Камень ломает ножницы. Как перехитрить кого угодно: практическое руководство - Уильям Паундстоун 12 стр.


Статья в Wall Street Journal принесла славу закону Бенфорда, но в то же время породила миф, что он представляет собой нечто вроде волшебного детектора лжи. С тех пор метод Нигрини получил широкое распространение в правоохранительных и налоговых органах, а также в частном секторе. Сегодня повседневный анализ данных о потребителях позволяет без труда выделить для дальнейшего изучения подозрительные числа. Тем не менее, анализ цифр остается относительно новым методом, недостаточно проверенным. Очень важно понимать, чего можно, а чего нельзя добиться с его помощью.

«Я регулярно расстраиваюсь, читая о том, как люди неправильно используют закон Бенфорда», – признался мне Нигрини. Вне всякого сомнения, человек услышал о законе Бенфорда, просмотрел статью в «Википедии» и решил, что любые числа, первая цифра которых не соответствует кривой распределения, – фальшивые. Этот вывод ни в коем случае нельзя назвать верным. Существует множество причин, когда первые цифры легитимных чисел могут не подчиняться распределению Бенфорда, и поэтому проверка первой цифры редко бывает полезной. Нигрини считает, что гораздо эффективнее анализ первых двух. В результате получается гистограмма из 100 столбиков. При достаточном массиве информации (тысячи чисел) соответствующие распределению Бенфорда данные образуют на графике гладкую кривую.

Другой полезный тест анализирует две последние цифры больших чисел. Это даже не проверка «закона Бенфорда». Таким способом выявляются характерные особенности придуманных чисел, выявленные Чапанисом. Обратите внимание что тест последних двух цифр работает даже в том случае, когда данные не должны подчиняться закону Бенфорда.

В руках профессионала анализ цифр состоит из множества разных тестов, а также вычисления их статистической значимости. Первичным этапом сравнения должна быть история одного и того же набора данных. Расходы текущего квартала должны сравниваться с расходами предыдущих кварталов. Нигрини называет этот принцип «Мое правило» – по модели базовых имен, предложенных программным обеспечением для новых файлов («Мой файл», «Моя таблица» и так далее). «Мое правило» позволяет избежать самой распространенной ошибки дилетантской нумерологии, предполагающей, что все числовые базы данных в точности описываются законом Бедфорда. Это ошибочное допущение. Признаки придуманных чисел, выявленные Чапанисом, тоже не обеспечивают стопроцентной защиты. По необъяснимым причинам эти методы могут оказаться применимыми или не применимыми в каждой конкретной ситуации. Проще и надежнее использовать в качестве основы прошлые распределения цифр.

В конце концов, любое мошенничество начинается в какой-то момент времени. Если Стэн из бухгалтерии начнет жульничать в следующий вторник, это изменит распределение цифр в его суммах – независимо от того, насколько настоящие данные близки к «случайным» или соответствовали кривой Бенфорда.

В качестве иллюстрации «Моего правила» Нигрини приводит эксперимент, придуманный в 2011 г. на занятиях по математике 17-летним студентом Ка Буи из немецкого города Кобленц. Класс был поделен на пять групп по четыре студента в каждой. Одним группам выдали газеты и предложили составить список из 500 чисел, встреченных в новостях. Другим группам предложили придумать 500 чисел. Смысл эксперимента в том, чтобы проверить, можно ли отличить числа, взятые из новостей, от придуманных, только по распределению составляющих их цифр.

Чтобы максимально затруднить задачу, группам, придумывавшим числа, предложили имитировать те, что могли быть найдены в газете (в противоположность случайным). В этом случае усиливалось сходство с настоящим мошенничеством, ведь преступник похож на хамелеона.

Ни один из пяти наборов данных, настоящих и поддельных, не соответствовал кривой Бенфорда, однако с первого взгляда можно было определить, что они составляют две группы. В одной наблюдались «высокие пики» – пары двух первых цифр, встречавшиеся гораздо чаще, чем ожидалось. Во второй пики были меньше, и распределение в большей степени соответствовало кривой Бенфорда. Как мы уже убедились, повторяющиеся пары цифр могут свидетельствовать о неосознанности – или о мошенничестве. Вы можете подумать, что группа с «маленькими пиками» состояла из настоящих чисел, взятых из газет. И ошибетесь.

Вспомните, что фальшивые числа придумывали группы из четырех человек. Из-за того, что разные люди неосознанно предпочитают разные цифры, вклад каждого члена группы делился на четыре. Это затруднило выявление обмана.

Реальный признак был следующим. В газетах много раз встречалось упоминание текущего года (2011) и нескольких предшествующих. Поэтому на гистограммах отмечался пик для 20 как пары первых цифр. Составители таблицы фальшивых чисел также использовали числа, обозначающие год, но в недостаточном количестве.

Тот, кто использует закон Бенфорда и признаки Чапаниса в качестве критерия, придет к выводу, что группы данных с маленькими пиками настоящие. Однако разумнее было бы проанализировать распределение цифр в числах, взятых из других газет. Это выявило бы массовое упоминание текущего года и помогло бы правильной идентификации.

Когда цифры в числах, имеющих важное значение, не соответствуют ожидаемому распределению, хороший следователь способен выяснить причину. Тем не менее, существует пара несложных, пригодных для самостоятельного применения тестов, помогающих быстро выявить подозрительные данные. На следующих нескольких страницах я продемонстрирую некоторые способы обнаружить вероятность фальсификации или манипулирования числами. Эти тесты предназначены в основном для различения реальных данных и на 100 процентов сфальсифицированных одним человеком. Столь резкий контраст вы увидите не всегда. Тем не менее, во многих случаях именно один-единственный мошенник снабжал своих жертв полностью фальшивыми данными. Эти тесты, используемые в качестве предварительной оценки, быстры и не связаны с дальнейшим анализом, а ведь вы, скорее всего, захотите его провести.


Каждое воскресенье владелица ресторана быстрого питания начинала с того, что придумывала объем продаж в долларах за предыдущую неделю. Ей нужно было отчитываться в налоговые органы. Любая цифра была фальшивой!

Совершенно случайно бухгалтер ресторана оказался одним из студентов Нигрини. Нигрини посмотрел на придуманные числа. «Ее выдали не первые цифры», – объяснил он. Ресторан быстрого питания с устойчивым бизнесом может иметь выручку, скажем, $5000 в день, с не очень большими отклонениями. Первые цифры данных не будут соответствовать распределению Бенфорда – и не должны. Подлог выдали две последние цифры. Ни одно из чисел не оканчивалось на 00. Это весьма распространенный признак, поскольку мошенники считают, что круглые числа выглядят недостаточно случайными. Кроме того, около 6,5 процента чисел оканчивались на 40 (при ожидаемой величине всего 1 процент). Использование пары 40 для двух последних цифр – неосознанная склонность владелицы ресторана.



Последние две цифры: 500 случайных чисел


Когда-нибудь ресторан быстрого питания выставят на продажу, и покупатели внимательно изучат бухгалтерские документы. Возможно, для демонстрации владелица придумает новые, раздутые числа. Возникнет ли у покупателей подозрение, что вся отчетность взята с потолка?

В мелком бизнесе показатели ежедневных продаж – это сумма большого количества граф «итого» в кассовых аппаратах. Последние две цифры этих сумм обычно бывают случайными – каждая пара от 00 до 99 появляется приблизительно в 1 проценте случаев.



Последние две цифры: 500 придуманных чисел


Однако не во всех документах указываются суммы с точностью до цента. Иногда их округляют до долларов или даже до тысяч долларов. В таких случаях нужно использовать две крайние цифры справа.

Чтобы провести тест последних цифр, подсчитайте, сколько раз каждая из возможных пар встречается в имеющемся наборе данных. Всего таких пар 100, и поэтому потребуется составить гистограмму из 100 столбиков.

Ниже приведена гистограмма, дающая представление, как выглядят реальные данные. Она характеризует выборку из 500 случайных чисел (сгенерированных программой Excel). Число 500 достаточно репрезентативно для мелкого бизнеса – это около 17 месяцев ежедневных продаж или десять лет еженедельных. Но даже при 500 числах гистограмма получается неравномерной, с довольно большими вариациями. В данном случае одна пара цифр (68) не появляется совсем, а три пары (10, 53 и 74) встречаются в два раза чаще, чем ожидаемый 1 процент. Это нормальные отклонения, характерные для случайных данных.

Теперь посмотрим на сфабрикованные данные.

Следующая гистограмма отображает распределение двух последних цифр в 500 числах, придуманных человеком. Более сильные вариации видны даже с первого взгляда. Две пары (93 и 94) встречаются более чем в 4 процентах чисел, что маловероятно для реальных данных. Двенадцать пар не встречаются вообще, и это тоже крайне маловероятно.

Задайте себе следующие три вопроса. Утвердительный ответ на любой из них должен усилить ваши подозрения.

a) По непонятной причине есть пара (или пары) цифр, встречающиеся чаще остальных?

б) Частота повторения сдвоенных цифр (особенно 00 и 55) меньше средней?

в) Убывающие пары (10, 21, 32, 43, 54, 65, 76, 87, 98) явно встречаются чаще других?

В приведенном примере ответ на вопрос (a) утвердителен. Кроме того, в массиве данных нет сдвоенных цифр (б). Приблизительно 10 процентов всех чисел должны оканчиваться на сдвоенные цифры. У нас таких 20 из 500, всего 4 процента. Пары 00, 55 и 77 вообще не встречаются.

Из 500 пар последних цифр 44 – убывающие. Это почти точно ожидаемые 9 процентов (из 100 возможных пар девять убывающие). Так, по критерию (в) данные не вызывают подозрений.

Наш набор данных не прошел два из трех тестов. Будь это суммы продаж мелкого бизнеса, стоило бы запросить дополнительную или более подробную информацию – и посмотреть, как отреагирует продавец.

Нет нужды беспокоиться, что вам придется считать вручную. На практике все это делается с помощью функций «копировать» и «вставить». Попросите данные в виде таблицы Excel или в совместимом с ней формате, чтобы без труда перенести их в шаблон теста, использующего закон Бенфорда. Примеры таких тестов можно бесплатно найти в интернете, в том числе один тест Нигрини (NigriniCycle.xlsx). Перенеся данные, выполните инструкции и заполните определенные столбцы заранее известными формулами. Результатом будут отформатированные гистограммы для двух последних цифр и итоги других распространенных тестов. Кроме того, программа вычисляет математическую оценку статистической значимости, что, конечно, гораздо надежнее простого просмотра полученных данных.

Резюме: Как распознать фальшивые числа

• Когда распределение цифр в последней группе данных отличается от обычного распределения, характерного для данной компании, это может быть признаком подлога.

• Растратчики и мошенники, придумывающие числа, неосознанно отдают предпочтение убывающим парам цифр (таким как 10, 21, 32 и так далее).

• Мошенники реже пользуются сдвоенными цифрами (например, 00 или 55), полагая, что они выглядят недостаточно «случайными».

12 Как распознать числа, которыми манипулировали

Один нью-йоркский страховой агент (фирма щедро оплачивала ему представительские расходы) оказался талантливым мошенником. Желая перейти на безбумажную документацию, его компания требовала сканы выписанных квитанций, а не сами квитанции. Страховой агент обнаружил: можно черной ручкой переправить в документе 1 на 7 или на 9, и на сканере с низким разрешением такое изменение незаметно.

Затем он пошел еще дальше и стал следить за тем, чтобы суммы, указанные в квитанциях, начинались с 1. Страховой агент мог позавтракать за 18 долларов и останавливаться в гостинице, где номер стоил 178 долларов. После этого он подправлял суммы и получал возмещение в размере 98 долларов за завтрак или 778 за гостиницу.

Одним росчерком пера он увеличил суточные расходы с 70 до 800. Но ему не повезло – аудиторский отдел страховой компании был одним из первых, применявших для анализа закон Бенфорда. В данном случае оказалось достаточно первых цифр, чтобы вызвать подозрения. Обнаружилось преобладание семерок и девяток и недостаток единиц. Расследование подтвердило факт обмана, и компания подала на страхового агента в суд, потребовав возмещения ущерба.

Подвергшиеся манипуляции числа могут представлять бо́льшую проблему, чем полностью выдуманные. В данном случае манипуляция означает, что кто-то ради личной выгоды уменьшил или увеличил реальную цифру. Изменение не обязательно должно быть таким грубым, как переправка 1 на 7. Зачастую достаточно достичь какого-то предела, цели или порога. Средства на представительские расходы обычно ограничены, при превышении либо не возмещаются суммы, либо требуются дополнительное подтверждение или документы. Можно ожидать, что предъявленные к возмещению цифры сосредоточатся чуть ниже границы.

«Это обычная практика для государственных чиновников», – заметил Марк Нигрини. Он изучил одно правительственное агентство. В нем сотрудникам выдавались закупочные карточки на сумму до 2500 долларов. Результат: «масса закупок на сумму 2500, 2499, 2496 долларов… Очевидно, это гениальные люди, которые говорили: “Не пишите 2501, пишите 2496 долларов. Я единственный из 35 000 правительственных чиновников знаю арифметику!” Однако все мы склонны думать как все, и поэтому каждый считает себя единственным».

Один из способов выявить исправления – проверка второй цифры. Сосчитайте, сколько раз каждая из десяти цифр встречается во втором знаке числа, справа от первой цифры. Для 74991 доллара вторая цифра – 4, и именно ее нужно учитывать при подсчете. Изобразите результаты в виде гистограммы.



Вторые цифры: числа, подвергшиеся манипуляции


С реальными числами не следует ожидать слишком большой вариации в частоте вторых цифр. Закон Бенфорда предсказывает, что самой распространенной второй цифрой будет 0, с частотой появления 12 процентов, а реже всего должна встречаться 9 – в 8,5 процента случаев. Однако зачастую вы видите такую диаграмму, как представлена на рисунке на следующей странице. Сплошная линия – это идеальная кривая Бенфорда для вторых цифр, а столбики – реальные результаты подсчета. На первый взгляд разница не очень велика, однако она существенна. В столбиках показан избыток цифр 8 и 9, а также нехватка всех остальных. Это может произойти при «круглом» лимите, например, 1000 долларов. Обычно люди указывают расходы, немного не дотягивающие до порога.

Эффект порога – довольно распространенное явление, но не стоит делать поспешных выводов, когда вы сталкиваетесь с чем-то подобным. Наемный работник, знающий, что компания оплачивает расходы на еду до 50 долларов, может попробовать питаться на 49 с мелочью. Он не делает компании одолжение, а просто играет по установленным правилам.

С другой стороны, работник, преувеличивший расходы на еду – или фальсифицирущий их, – тоже имеет все основания не превышать установленного порога. Получив такие результаты, вы, возможно, захотите проверить поведение сотрудника – либо он представляет к оплате чеки, не превышающие порога, либо не переходит установленные границы, либо тут есть признаки подделки.

Иногда установленные пороги оканчиваются цифрой 5, например, 25 долларов. В таком случае на манипуляцию может указывать избыток троек и четверок во второй цифре.


Кевин Лоуренс приходил к инвесторам с беспроигрышным бизнес-планом. Его компания под названием Health Maintenance Centers (HMC) разрабатывала электронное оборудование и программное обеспечение для оздоровительных клубов: благодаря аппаратуре проще следить за состоянием клиентов на тренажерах. Это превратило бы каждое занятие в стрессовый тест, позволяя тренеру или врачу регулировать нагрузки и режим тренировок. Лоуренс продал акции и ценные бумаги HMC на сумму 74 миллиона долларов 5000 инвесторам по всей стране.

17 января 2002 г. Комиссия по ценным бумагам и биржам подала иск против Лоуренса и HMC, обвинив в мошенничестве в инвестиционной сфере. Обещанное IPO так и не состоялось. Вместо этого принадлежавшие инвесторам 163 миллиона долларов ушли к Лоуренсу и его подельникам. Комиссия обвиняла Лоуренса, что он потратил 2,1 миллиона долларов на 23 роскошных автомобиля, 1 миллион долларов на яхты 1,7 – на недвижимость и драгоценности, в том числе на обручальное кольцо стоимостью 330 тысяч долларов для Стейси Грей, еще одной обвиняемой.

Вероятно, Лоуренс не собирался мошенничать. Просто он принадлежал к тому типу предпринимателей, у которых привлекать деньги получается лучше, чем вкладывать их в успешные проекты, – его можно сравнить не с Берни Мэдоффом, а скорее с Максом Бялыстоком [16]. Числа в бухгалтерской документации HMC отражали реальные операции. Но результаты некоторых цифровых тестов выглядели в высшей степени подозрительно. К сожалению, тесты провели только после того, как проблемы HMC получили огласку (органы судебно-бухгалтерской экспертизы г. Лейк-Освего, и независимо от них Марк Нигрини). Если бы инвесторы HMC проанализировали распределение цифр раньше, то могли бы сохранить деньги и избежать ущерба.

Назад Дальше