Взаимозависимость входящих в выборку данных может стать причиной серьезных ошибок. В 1936 году ныне забытый журнал "Literary Digest" предпринял опрос для предсказания исхода борьбы между кандидатами в президенты Франклином Рузвельтом и Альфредом Лэндоном. Редакция разослала лицам, отобранным с использованием телефонной книги и данных о регистрации автомобилей, около десяти миллионов опросных листов в виде открыток с оплаченным возвратом. Подсчет возвращенных открыток показал, что за Лэндона собираются голосовать 59% избирателей, а за Рузвельта только 41%. Однако в ходе выборов Лэндон получил 19% голосов, .в то время как за Рузвельта проголосовали 61% избирателей. Дело в том, что в середине 30-х годов владельцы автомобилей и телефонов не составляли типичной выборки американских избирателей: их избирательные предпочтения были обусловлены их уровнем жизни, который был тогда не по карману большинству населения.
***
По-настоящему независимые наблюдения дают богатую информацию о вероятностях. Возьмем для примера кости.
Все шесть сторон костяного кубика могут выпасть с равной вероятностью. Если графически представить вероятность получить каждое из шести возможных значений, мы получим горизонтальную прямую на уровне /6. График не будет иметь ничего общего с нормальной кривой, как выборка, состоящая из одного броска, ничего не скажет о шансах ожидания того или иного значения кости. Мы окажемся в состоянии слепых, ощупывающих слона.
Бросим теперь кость шесть раз и посмотрим, что получится. (Я моделировал этот опыт на моем компьютере, чтобы быть уверенным в том, что в результате получаются случайные числа.) Первая серия из шести бросков дала четыре пятерки, одну шестерку и одну четверку, в среднем ровно 5,0. Во второй серии получилась смесь из трех шестерок, двух четверок и одной двойки, в среднем 4,7. Информации не намного больше.
После десяти испытаний по шесть бросков каждый средние результаты по шести броскам стали группироваться около значения 3,5, являющегося средним числом очков на поверхности кости: (1 + 2 + + 3 + 4 + 5 + 6):6 = 3,5 - и ровно половиной величины математического ожидания при бросании двух костей. Шесть моих средних были ниже 3,5 и четыре превышали это число. Вторая серия из десяти бросков дала следующие результаты: четыре раза среднее значение было ниже 3,0, четыре раза оно превышало 4,0, было также по одному значению выше 4,5 и ниже 2,5.
Следующим шагом было определение среднего значения первых десяти испытаний по шесть бросков каждый. В то время как распределение в каждом из этих испытаний, рассматриваемых по отдельности, само по себе мало о чем говорило, среднее от средних оказалось равным 3,48! Теперь среднее уточнилось, но среднее квадратичное отклонение оказалось равным 0,82 - значительно большим, чем хотелось бы.
Иными словами, в семи из десяти испытаний среднее значение оказалось в пределах 3,48 + 0,82 и 3,48 - 0,82, или между 4,30 и 2,66; в остальных трех испытаниях разброс результатов был еще большим.
Тогда я заставил компьютер выполнить 256 испытаний по шесть бросков каждое. Первые 256 испытаний дали близкую к ожидаемому значению величину 3,49 со средним квадратичным отклонением 0,69, то есть две трети результатов оказались в интервале между 4,18 и 2,80. Только в 10% испытаний средние значения были меньше 2,5 или больше 4,5, в то время как больше половины значений попало в интервал от 3,0 до 4,0.
Продолжая насиловать компьютер, я повторил серию из 256 испытаний десять раз. Усреднив результаты, полученные в каждой из десяти выборок, я затем усреднил эти средние и получил 3,499 (я привожу результат с точностью до трех знаков после запятой, чтобы показать степень приближения к 3,5). Впечатляющим оказалось уменьшение величины среднего квадратичного отклонения до 0,044. При этом пять средних оказались ниже 3,5 и пять выше, а семь из десяти выборок по 256 испытаний дали значение в пределах от 3,455 до 3,543. Это неплохая точность.
Как выяснил Якоб Бернулли, количества важны. Это он обратил внимание на то, что среднее от средних значений отдельных выборок удивительным образом снижает дисперсию вокруг основного среднего значения, - утверждение, известное как центральная предельная теорема. Эта теорема была впервые сформулирована Лапласом в 1809 году в работе, которую он закончил и опубликовал перед тем, как в 1810 году ознакомился с "Theoria Motus" Гаусса.
Среднее от средних интересно еще и с другой стороны. Мы начали эксперименты с бросанием шестигранной кости, каждая грань которой имеет равные шансы выпасть. Распределение получалось плоским, не имеющим ничего общего с нормальным. По мере того как компьютер моделировал все большее и большее число бросков, накапливая число выборок, мы получали всё больше и больше информации о свойствах кости.
Очень редко среднее значение в испытании из шести бросков оказывалось близким к шести или к единице; большая часть их оказывалась между двумя и тремя или четырьмя и пятью. Структура результатов в точности повторила расчеты Кардано, выполненные им для игры 250 лет назад, когда он начал нащупывать подходы к вероятностным законам. Множество бросков одной кости дают среднее значение 3,5. Отсюда ясно, что многократное бросание двух костей даст в среднем удвоенную величину, то есть 7,0. Как показал Кардано, значения, отличающиеся от 7 в ту или другую сторону, будут встречаться с одинаково убывающей частотой по мере продвижения от 7 к 2 или к 12.
***
Нормальное распределение является основным элементом большинства систем управления риском. На нем целиком основан страховой бизнес, потому что от пожара в Атланте не загораются дома в Чикаго, а смерть определенного человека в одном месте, как правило, не имеет отношения к смерти другого человека в другом месте и в другое время. Когда страховые компании собирают сведения о миллионах людей обоего пола всех возрастов, значения ожидаемой продолжительности жизни оказываются распределенными по нормальной кривой. В силу этого страховые компании способны с большой степенью надежности оценивать продолжительность жизни разных групп населения. Они могут не только определять ожидаемую среднюю продолжительность жизни, но и диапазоны, в которых она может колебаться из года в год. Уточняя эти оценки на основе дополнительных данных, таких, как истории болезней, число курильщиков, постоянные места проживания, профессиональная деятельность, эти компании повышают точность оценки ожидаемой продолжительности жизни .
Порой нормальное распределение дает гораздо больше важной информации, чем простые оценки представительности выборки. Нормальное распределение менее вероятно, хотя и не исключено, когда наблюдения зависимы друг от друга, то есть когда вероятность события определяется предыдущим событием. Например, если у лучника проблемы со зрением, стрелы будут ложиться слева от яблочка, т. е. центр распределения окажется сдвинутым. В подобных ситуациях распределение относительно среднего значения обычно оказывается асимметричным.
В таких случаях мы можем воспользоваться рассуждением наоборот. Если независимость событий является необходимым условием нормального распределения, можно предположить, что данные, распределение которых представлено колоколообразной кривой, получены на основе независимых наблюдений. Теперь мы можем поставить несколько интересных вопросов.
Насколько точно изменения курса акций на бирже подчинены законам нормального распределения? Некоторые знатоки рынка утверждают, что курс подвержен случайным колебаниям, напоминающим пошатывающегося пьяного, пытающегося ухватиться за фонарный столб. Они полагают, что у курса не больше памяти, чем у рулетки или пары костей, и что каждое наблюдение здесь независимо от предыдущего наблюдения. Сегодняшнее движение цен не зависит от того, что произошло минуту назад, вчера или позавчера.
Лучший способ решения вопроса о том, являются ли изменения курса акций независимыми событиями, заключается в сравнении колебаний курса с нормальным распределением. У нас есть веские основания утверждать, что эти колебания подчиняются нормальному закону, и в этом нет ничего удивительного. В условиях постоянной изменчивости и конкурентной борьбы на нашем рынке капитала, когда каждый инвестор стремится переиграть других, новая информация мгновенно отражается на котировках. Когда выясняется падение прибыли у General Motors или Merck объявляет о выпуске нового чудодейственного лекарства, котировки не стоят на месте в ожидании, пока инвесторы переварят информацию. Ни один инвестор не станет ждать, пока начнут действовать другие. На рынке действуют сворой, и новая информация немедленно изменит котировки акций General Motors или Merck. При этом сама новая информация поступает в случайном порядке. В силу этого изменения котировок непредсказуемы.
Интересные данные в поддержку этой точки зрения были приведены в 1950-х годах профессором Чикагского университета Гарри Робертсом (Roberts). Роберте с помощью компьютера брал случайные числа из наборов с тем же средним и тем же средним квадратичным отклонением, какие наблюдались у цен на фондовой бирже. Затем он начертил диаграмму последовательной смены этих случайных чисел. Результаты оказались идентичными с результатами аналитиков рынков ценных бумаг, пытающихся предугадать движение котировок. Реальная динамика цен и динамика случайных чисел, выданных компьютером, оказались практически неразличимыми. Возможно, что и на самом деле биржевые котировки не имеют памяти.
На приведенных диаграммах представлены в процентах месячные, квартальные и годовые изменения котировок столь любимого профессиональными инвесторами индекса Standard & Poor's 500. Данные охватывают период с января 1926-го по декабрь 1995 года и содержат результаты 840 месячных наблюдений, 280 квартальных и 70 годовых .
Хотя диаграммы отличаются друг от друга, у них есть две общие черты. Во-первых, как, по слухам, говаривал Д. П. Морган, "рынок переменчив". Действительно, фондовый рынок непредсказуем, на нем может случиться все что угодно. Во-вторых, большая часть наблюдений попадает вправо от нуля: в среднем рынок чаще рос, чем падал.
Нормальность распределения - это жесткая проверка гипотезы случайных колебаний рынка. Но нужна одна важная оговорка. Даже если гипотеза случайных колебаний адекватно описывает ситуацию на фондовом рынке, даже если изменения котировок описываются нормальным распределением, среднее значение изменений всегда отлично от нуля. Тенденция к повышению котировок не должна нас удивлять. Состояние владельцев акций со временем растет, как и сбережения, доходы и прибыли корпораций. Поскольку по большей части котировки не падают, а растут, среднее значение их изменений оказывается положительным.
Сопоставление годовых данных показывает, что все среднегодовые изменения котировок нетипичны. Котировки беспорядочно растут со средней скоростью 7,7% в год. Среднее квадратичное отклонение равно 19,3%, что означает, что в любой год /3 времени котировки изменяются в интервале от +27,0% до -12,1%. Хотя максимальный подъем котировок до 46,4% наблюдался на протяжении только 2,5% лет, то есть раз в сорок лет, утешает то, что и максимальное падение котировок до -31,6% оказалось возможным не чаще чем раз в сорок лет.
На обследуемом отрезке времени котировки росли в течение 47 из 70 лет, или каждые два года из трех. При этом они падали в течение 23 лет, почти половину этого срока, т. е. в течение десяти лет они выходили за пределы среднего квадратичного отклонения, то есть больше, чем на 12,1%. Среднее же падение за эти 22 несчастливых года составило 15,2%.
Достаточно ли 70 наблюдений, чтобы подтвердить вывод о случайном изменении котировок акций? Возможно, нет. Известно, что при бросании кости получаемые результаты случайны, но если бросить кость только шесть раз, то ничего похожего на нормальное распределение мы не увидим. Нужно существенно увеличить число бросков, чтобы результаты стали согласовываться с теорией.
Распределение 280 квартальных наблюдений гораздо ближе к нормальной кривой, чем 70 годовых. Но величина дисперсии очень велика и никоим образом не симметрична, поскольку наличествует небольшое число очень значительных изменений. Величина среднего изменения за квартал равна +2,0%, но значение среднего квадратичного отклонения 12,0% говорит, что это значение (+2,0%) вряд ли типично для квартальных изменений. 45% кварталов показали изменения, меньшие чем 2,0%, а 55% - большие.
Инвестор, который бы купил портфель акций и держал его 70 лет, заработал бы очень неплохие деньги. Но инвестор, который бы рассчитывал на то, что каждый квартал будет зарабатывать на акциях по 2%, был бы дураком. (Заметьте, что я здесь использую только прошлое время - у нас нет гарантий, что в будущем фондовый рынок будет вести себя так же, как в прошлом.)
Распределение 840 помесячных изменений котировок отличается большей упорядоченностью, чем в случае квартальных и годовых изменений. Среднемесячное изменение составило +0,6%. Если мы вычтем 0,6% из каждого наблюдаемого значения, чтобы сделать поправку на постоянный рост котировок за весь рассматриваемый период, то среднее изменение составит +0,00000000000000002%, причем в течение 50,6% месяца оно было положительным, а в течение 49,4% месяца отрицательным. Средняя для первого квартиля составила -2,78%, а для третьего квартиля +2,91%. Почти безупречная симметричность.
Случайный характер месячных колебаний проявляется также в кратковременности периодов с постоянным направлением изменения котировок. Сохранение тенденции в течение двух месяцев наблюдалось не более половины исследуемого отрезка времени, и только 9% времени направление изменения котировок не менялось в течение пяти месяцев.
Итак, изменение котировок акций носит чисто случайный характер, по крайней мере если судить по 840 месячным наблюдениям, - ведь мы не имели бы такой формы распределения данных вокруг средней, если бы изменения цен не были взаимно независимыми - как результат бросания костей. После внесения поправок на долговременную тенденцию роста частота повышения и понижения котировок практически сравнялись; серии однонаправленных изменений встречались редко; значение коэффициентов изменчивости близко к теоретическому.
Считая, что можно руководствоваться предположением Бернулли о сходстве будущего с прошлым, мы вправе использовать эту информацию для вычисления вероятности того, что в некоем месяце котировки изменятся на некую определенную величину. Среднемесячное изменение значения индекса S&P было в этот период 0,6%, а среднее квадратичное отклонение - 5,8%. Если изменения котировок распределены случайно, то мы имеем 68% шансов за то, что в любой месяц изменение котировок окажется в интервале от -5,2% до +6,4%. Предположим, мы хотим узнать вероятность того, что цены в течение какого-то месяца упадут. Ответ - 45%, то есть чуть меньше половины времени. Но вероятность падения курса более чем на 10% равна только 3,5%, иными словами, такое падение возможно в одном месяце из тридцати; изменение курса за месяц на 10% вверх или вниз случалось примерно один раз в пятнадцать месяцев.
В 33 из 840 месячных наблюдений, то есть в 4% наблюдений, наблюдаемые значения оказались за пределами двух стандартных отклонений от среднего значения, равного +0,6%, то есть изменения находились в интервале от -11% до +12,2%. Хотя 33 сильных отклонения - это меньше, чем можно было бы ожидать от совершенно случайной серии наблюдений, 21 из них было в сторону падения; в совершенно случайной серии это число должно было бы быть равно 16 или 17. У рынка с длительной тенденцией к росту курса могло бы быть и меньше неприятностей, чем 16 или 17 месяцев значительного падения из 816.
В пределе рынок - это не случайные колебания. В пределе на рынке с большей вероятностью можно потерять, чем выиграть. Рынок - это опасное место.