Я часто сталкиваюсь с вопросами типа: "Кто Вы такой, чтобы говорить, что я всего лишь удачлив в своей жизни?". Никто, в действительности, не верит, что он или она были просто удачливы. Мой подход заключается в том, чтобы с помощью генератора Монте-Карло моделировать вполне случайные ситуации. Мы можем применить методы, прямо противоположные обычным, то есть вместо поисков и анализа атрибутов реальных людей пытаться создать искусственных с точно известными признаками. Таким образом, мы можем моделировать ситуации, которые зависят от чистой, настоящей удачи, без тени всего того, что мы называли неудачей в Таблице 1. Другими словами, будем создавать чистых бестелесных человеков, над которыми можно посмеяться, они в соответствии с проектом будут лишены любой тени способностей (подобно плацебо-таблеткам). Мы в Главе 5 видели, как люди могут выживать в зависимости от черт, которые на мгновение соответствуют данной структуре случайности. Здесь рассмотрим более простую ситуацию, в которой мы знаем структуру случайности. Первое такое упражнение ― "улучшение" старого популярного высказывания, что даже сломанные часы верны два раза в день. Мы пойдем немного дальше, чтобы показать, что статистика ― обоюдоострый нож. Давайте воспользуемся генератором Монте-Карло и создадим популяцию из 10 000 воображаемых инвестиционных менеджеров (можно обойтись без генератора, воспользовавшись монетой или даже простой алгеброй, но он более иллюстративен и забавен). Предположим, каждый из них участвует в совершенно справедливой игре: у каждого вероятность получения 10 000$ в конце года равна 50 %, вероятность проигрыша 10 000$ также 50 %. Позволим себе задать дополнительное ограничение: как только менеджер завершает год с потерей денег, он выбрасывается из выборки ― до свидания и будь здоров. Таким образом, мы будем работать подобно легендарному спекулянту Джорджу Соросу, который, как считают, говорил (с восточно-европейским акцентом) своим менеджерам: "Половина из вас, парни, вылетит к следующему году". Подобно Соросу, мы задаем чрезвычайно высокие стандарты: ищем менеджеров только с незапятнанным отчетом о сделках. Мы не терпим малоуспешных исполнителей.
Генератор Монте-Карло бросит монету, если выпадет орел, менеджер будет делать 10 000$ за этот год, решка ― терять такую же сумму. Для первого года мы ожидаем, что по его завершению 5000 менеджеров будут в плюсах на 10 000$ каждый, и 5000 в минусах на 10 000$. Теперь запускаем игру за второй год. Снова мы можем ожидать, что 2500 менеджеров будут в плюсах два года кряду, по завершении третьего года ― 1250, четвертого ― 625, пятого ― 313. Мы имеем теперь в этой простой справедливой игре 313 менеджеров, которые сделали деньги в течение пяти лет подряд. Из чистой удачи.
Никто не должен быть компетентен
Давайте сделаем интереснее: создадим когорту, состоящую исключительно из некомпетентных менеджеров. Некомпетентного менеджера определим как менеджера, который имеет отрицательный ожидаемый доход, эквивалент шансов, складывающихся против него. Теперь заставляем генератор Монте-Карло вытягивать шары из урны. Урна содержит 100 шаров, из них 45 черных и 55 красных шаров. Заменяя вытянутый шар, мы сохраняем то же соотношение красных и черных шаров. Если вытянем черный шар, менеджер заработает 10 000$, если красный шар, потеряет 10 000$. Таким образом, ожидается, что менеджер заработает 10 000$ с вероятностью 45 %, и потеряет 10 000$ с вероятностью 55 %. В среднем, менеджер потеряет 1000$ в каждом раунде, ― но только в среднем.
В конце первого года мы все еще ожидаем, что 4500 менеджеров имеют прибыль (45 % из них), в конце второго ― 45 % из этого числа равно 2025, третьего ― 911, четвертого ― 410, пятого ― 184. Давайте дадим выжившим менеджерам имена и оденем их в деловые костюмы. Они составляют менее 2 % первоначальной когорты. Но все внимание сосредоточено на них и никто не упомянет другие 98 %. Что мы можем заключить?
Первый противоречащий интуиции пункт ― популяция, состоящая полностью из плохих менеджеров, произведет малое количество великолепных отчетов о сделках. На самом деле, обнаруживая менеджера у своей двери, невозможно вычислить, является ли он хорошим или плохим менеджером. Результаты заметно не изменились бы, даже если популяция была бы полностью составлена из менеджеров, которые, как ожидается, в конечном счете будут терять деньги. Почему? Ведь вследствие волатильности некоторые из них будут делать деньги. Мы здесь видим, что волатильность фактически помогает плохим инвестиционным решениям.
Второй, противоречащий интуиции пункт, ― ожидание максимума отчетов о сделках, в котором мы заинтересованы, больше зависит от размера начальной выборки, чем от индивидуальных шансов менеджера. Другими словами, число менеджеров с великолепными отчетами о сделках на данном рынке зависит гораздо больше от числа людей, которые стартовали в инвестиционном бизнесе (вместо поступления в школу стоматологов), чем от их способности производить прибыль. Оно также зависит от волатильности. Почему я использую понятие ожидание максимума? Поскольку не интересуюсь средним отчетом о сделках вовсе. Я хочу видеть только лучших из менеджеров, а не всех менеджеров. Это означает, что мы увидим большее количество "превосходных менеджеров" в 2002, чем в 1998, если когорта новичков в 1997 была больше, чем в 1993, ― я могу благополучно сказать, что так было.
Эргодичность
Если говорить техническим языком, то люди думают, будто бы они могут вычислить свойства распределения из выборки, свидетелями которой они стали. Когда появляются вопросы, которые зависят от максимума, то, в целом, выводится другое распределение ― распределение лучших исполнителей. Мы называем разницу между таким средним распределением и безусловным распределением победителей и проигравших пристрастием выживания. Факт, что приблизительно 3 % начальной когорты будут делать деньги пять лет подряд. Кроме того, этот пример иллюстрирует свойства эргодичности, а именно, время устранит раздражающие эффекты случайности. Забегая вперед, скажу, что несмотря на то что эти менеджеры были прибыльны в прошлых пяти годах, мы ожидаем, что в будущем периоде времени они станут убыточными. И будут поживать не лучше, чем те, из начальной когорты, кто потерпел в этом упражнении неудачу ранее. Ох уж, эта долгосрочность!
Несколько лет назад, когда я сказал A., бывшему тогда типа Хозяина-Вселенной, что отчеты о сделках относились к делу гораздо меньше, чем ему казалось, он нашел это замечание настолько оскорбительным, что даже яростно бросил в меня свою зажигалку. Эпизод научил меня многому. Помните, что никто не принимает случайность в своем собственном успехе, ― только в своей неудаче. Его эго было раздуто, поскольку он возглавлял отдел "великих трейдеров", которые тогда, временно, делали состояние на рынках. Впоследствии, в течение ужасной нью-йоркской зимы 1994 года, они "взорвались" (крушение рынка облигаций последовало за неожиданным изменением ставки процента Аланом Гринспеном [29] ). Интересно, спустя шесть лет я едва ли мог найти кого-нибудь из них, кто все еще занимался торговлей (эргодичность).
Вспомним, что пристрастие выживания зависит от размера начальной популяции. Информация, что человек сделал деньги в прошлом, сама по себе не является ни значимой, ни уместной. Мы должны знать размер популяции, из которой он вышел. Другими словами, без знания того, сколько менеджеров попробовали торговать и потерпели неудачу, мы не способны оценить обоснованность отчета о сделках. Если начальная популяция состояла из десяти менеджеров, то я, не моргнув глазом, дал бы исполнителю половину моих сбережений. Если же начальная популяция состояла из 10 000 менеджеров, я бы игнорировал результаты. В общем случае, имеет место последняя ситуация: в наши дни очень много людей притянуто на финансовые рынки. Много выпускников колледжей занимаются торговлей, в начале карьеры неудача, а затем переход в стоматологическую школу.
Если, как в сказке, эти вымышленные менеджеры превратились бы в реальных людей, то один из них мог бы стать человеком, с которым я встречаюсь завтра, в 11.45 утра. Почему я выбрал 11.45 утра? Я буду спрашивать его о стиле торговли, мне нужно знать, как он совершает сделки. И если менеджер слишком сильно акцентирует внимание на своем отчете о сделках, я буду иметь возможность сказать, что тороплюсь на деловой ланч.
Жизнь ― это совпадение
Теперь мы посмотрим в реальной жизни на расширения нашего пристрастия в понимании распределения совпадений.
Таинственное письмо
Вы получаете анонимное письмо второго января, где Вам сообщают, что в течение месяца рынок будет повышаться. Это оказывается правдой, но Вы игнорируете его в силу известного эффекта января (исторически сложилось так, что акции росли в течение января). Вы получаете другое письмо первого февраля, где предупреждают, что рынок понизится. Это снова оказывается правдой. Потом Вы получаете другое письмо, первого марта, ― та же история. К июлю Вы заинтригованы предвидением анонимного человека. и Вас просят вложить капитал в специальный оффшорный фонд. Вы вкладываете туда все ваши сбережения. Двумя месяцами позже Ваши деньги пропали. Вы проливаете слезы на плече вашего соседа, и он сообщает вам, что помнит, как получил два таких же таинственных письма. Но почтовые послания остановились на втором письме. Он вспоминает, что первое предсказание был правильным, а второе ― нет.
Что случилось? А трюк в следующем. Мошенник-оператор тянет 10 000 имен из телефонной книги. Он отправляет бычье письмо одной половине выборки, и медвежье ― другой. В следующем месяце, он выбирает имена людей, кому он отправил письма с правильным предсказанием, то есть 5000 имен. В следующем месяце он делает то же самое для оставшихся 2500 имен, пока список не сузится до 500 человек. Из них 200 будут жертвами. Инвестиция нескольких тысяч долларов в почтовые марки превратится в несколько миллионов.
Прерванная игра в теннис
Часто, при просмотре по телевидению теннисного поединка, Вас засыпают рекламными объявлениями от фондов, которые сделали в течение некоторого периода (до этой минуты) лучший результат, больший на некоторый процент, чем у других. Но опять, разве рекламировался бы кто-нибудь, если бы он не переиграл рынок? Существует довольно высокая вероятность инвестиции, ищущей вас, успех которой полностью вызван случайностью. Такое явление экономисты и страховщики называют неблагоприятной селекцией. Оценка инвестиции, которая ищет Вас, требует более строгих стандартов, чем оценка инвестиции, которую ищете Вы, вследствие такого пристрастного выбора. Например, идя в когорту, составленную из 10 000 менеджеров, я имею 2/100 шанса для обнаружения поддельного, но оставшегося в живых. Оставаясь дома и отвечая на звонки в мою дверь, шанс ходатайствующей стороны, оказаться поддельной, но оставшейся в живых, ближе к 100 %.
Парадокс дня рождения
Наиболее интуитивный способ описать проблему выкапывания данных не статистику ― применить то, что называется парадоксом дня рождения, хотя считать настоящим парадоксом нельзя, ведь это просто причуда восприятия. Если Вы встречаете кого-то случайно, есть один шанс из 365,25, что Ваши с ним дни рождения совпадают, и значительно меньший шанс совпадения с ним года рождения. Итак, тот же самый день рождения был бы совпадением, которое Вы бы обсуждали за обеденным столом. Теперь посмотрим на ситуацию, в которой в комнате находятся 23 человека. Каковы шансы, что там окажутся два человека с одинаковым днем рождения? Приблизительно 50 %. Поскольку мы не определяем, у каких людей должны совпадать дни рождения, подходят любые пары.
Мир тесен!
Подобное неправильное представление о вероятности возникает в результате случайных столкновений, которые могут произойти с родственниками или друзьями в самых неожиданных местах. "Мир тесен" произносится часто и с удивлением. Но такие события не невероятны, хотя мир намного больше, чем мы думаем.
Только мы не проверяем шансы встретить определенного человека, в определенном месте и в определенное время. Скорее, мы просто прикидываем шансы любой встречи, с любым человеком, которого мы когда-либо встречали в прошлом, в любом месте, которое мы посетим в течение интересующего периода. Вероятность последнего значительно выше, возможно, в несколько тысяч раз.
Когда статистик смотрит на выборку данных , чтобы проверить заданное соотношение, скажем, разведать корреляцию между возникновением данного события, типа политического заявления, и волатильностью рынка акций, шансы таковы, что результаты можно принимать всерьез. Но когда в компьютер забрасывают данные в поисках любого соотношения, можно сказать с уверенностью, что проявится ложная связь, типа зависимость рынка акций от длины женских юбок. И точно так же, как совпадения дней рождений, это поразит людей.
Раскапывание данных, статистика и шарлатанство
Какова вероятность для Вас выиграть дважды в нью-джерсийской лотерее? Один шанс из 17 триллионов. И все же это случилось с Эвелин Адамс, кого читатель мог бы считать избранницей судьбы. Используя метод, который мы развивали выше, Перси Диаконис и Фредерик Мостеллер из Гарварда, оценили шансы как 30 к 1, что кто-либо где-нибудь полностью неоднозначным способом станет настолько удачливым!
Некоторые люди переносят свою деятельность по выкапыванию данных в богословие. В конце концов, в древнем Средиземноморье практиковалось чтение потенциальных сообщений по внутренностям птиц. Интересное расширение выкапывания данных на библейские толкования представлено в Коде Библии неким Майклом Дроснином. Дроснин, бывший журналист (по-видимому, не замешанный в любом обучении статистике), при содействии "математика" помог "предсказать" убийство премьер-министра Израиля Рабина, расшифровывая код Библии. Он информировал Рабина, который, очевидно, не принял предупреждение слишком серьезно. Код Библии находит статистические нерегулярности в Библии, что помогает предсказывать некоторые подобные события. Само собой разумеется, что книга имела хороший сбыт.
Лучшая книга, какую я когда-либо читал!
Мое любимое времяпрепровождение ― походы в книжные магазины, где я бесцельно двигаюсь от книги к книге, пытаясь принять решение, стоит ли тратить время на ее чтение. Мои покупки часто основаны на импульсах, базирующихся на поверхностных, но наводящих на размышления ключах. Часто лишь только суперобложка помогает мне принять решение. Ведь обычно она содержат похвалу кого-то, известного или не очень, или выдержки из книжного обзора. Хорошая похвала известного и уважаемого человека или известного журнала могла бы подвигнуть меня на покупку книги.
В чем проблема? Я имею тенденцию путать книжный обзор, который, как предполагается, является оценкой качества книги, с обзорами лучших книг, испорченными теми же самыми пристрастиями выживания. Я путаю распределение максимума переменной с распределением самой переменной. Издатель никогда не будет печатать на суперобложке что-либо, кроме лучших похвал. Некоторые авторы идут даже на шаг дальше, публикуя прохладный или даже неблагоприятный книжный обзор, но выбирая в нем слова, которые кажутся хвалебными для книги. Один такой пример ― некий Пауль Вилмотт ― английский финансовый математик, человек редкого блеска и непочтительности. Он объявил, что я дал ему "первый плохой обзор", и все же он использовал выдержки из этого обзора в качестве похвалы на суперобложке (позже мы стали друзьями, что позволило мне получить подтверждение и от него).
Первый раз меня одурачило такое пристрастие при покупках в возрасте 16 лет. Это была книга Манхэттэнское перемещение Джона Дос Пассеса, американского автора. Я основывался на похвале со суперобложки философа Жан-Поля Сартра, из которой следовало, что Дос Пассес считался самым ярким писателем нашего времени. Эта простая ремарка, которую выпаливают, возможно, в состоянии опьянения или чрезвычайного энтузиазма, вызвала потребность прочтения книги Дос Пассеса представителями европейских интеллектуальных кругов, поскольку ремарка Сартра была ошибочно принята за оценку качества работы Дос Пассеса, вместо того, чем она являлась на самом деле ― просто лучшей ремаркой. (Несмотря на получение Нобелевской премии по литературе, Дос Пассес так и остался в эабвении.)
Тестер исторических данных
Программист помог мне построить тестировщик исторических данных или бэктестер ― программу, связанную с базой данных исторических цен, которая позволяет мне проверять гипотетическую прошлую результативность любого правила для торговли средней сложности. Я могу просто применять механическое правило торговли, подобное покупке акции, если она закрывается более чем на 1,83 % выше ее средней цены предыдущей недели, и немедленно получаю отчет относительно прошлой результативности такого правила. Экран высветит мой гипотетический отчет о сделках, связанных с этим правилом торговли. Если мне не нравятся результаты, я могу изменять процент, выбрав, скажем, 1,2 %. Также я могу усложнить правило. Я буду продолжать пробовать, пока не найду устраивающий меня набор правил.
Что я делаю? Точно так же ищу оставшихся в живых в пределах набора правил, которые, возможно, могут работать. Я приспосабливаю правило к данным. Такая деятельность называется выискиванием данных. Чем больше я пробую, тем больше вероятность простой удачной находки правила, которое работало на прошлых данных. Случайный ряд всегда будет представлять некоторую обнаружимую модель. Я убежден, что существует торгуемая на Западе ценная бумага, которая на 100 % коррелированна с изменениями температуры в Улан-Баторе, столице Монголии.
Говоря техническим языком, есть даже худшие расширения. Так, из недавней выдающейся статье Салливана, Тиммермана и Уайта [30] следует, что правила, которые могут успешно использоваться сегодня, могут быть результатом пристрастия выживания.
Предположим, какое-то время инвесторы экспериментировали с чисто техническими правилами торговли, которые были собраны из тысячи параметризаций разнообразных типов правил. С течением времени правила, которые исторически подтвердили свою результативность, заслуживают большего внимания инвестиционного сообщества, в то время как неудачные правила торговли, более вероятно, будут забыты …. Если рассматривается достаточное число правил торговли в течение времени, то некоторые правила, благодаря чистой удаче, даже в очень большой выборке, дают превосходный результат, даже если совсем не обладают прогнозирующей властью над доходностью актива. Безусловно, вывод, основанный исключительно на подмножестве выживших правил торговли, может вводить в заблуждение в этом контексте, так как он не учитывает полный набор начальных правил торговли, большинство из которых вряд ли будет иметь меньшую результативность.