Более пристальный взгляд на случайность позволяет обнаружить еще менее заметные признаки ее бунта против ограничений. Примерно столетие назад статистик Владислав Борткевич провел ставшее впоследствии классическим исследование смертей в прусской армии. В работе подчеркивалась странная связь между случайностью и универсальной математической константой е. Это нескончаемое иррациональное число (2,718281…) частенько всплывает в природных процессах, скорость которых зависит от текущего состояния системы. Примеры – рост населения или радиоактивный распад.
Данные Борткевича показывают, что это универсальное число можно отыскать в случайных событиях – например, в риске погибнуть от удара лошадиным копытом. Согласно воинским рапортам, всем прусским солдатам грозил небольшой (но конечный по величине) риск скончаться из-за лягающегося скакуна. В среднем один такой случай приходился на каждые 1,64 года. Борткевич обнаружил, что среди 200 изученных им рапортов 109 не сообщали ни о каких смертных случаях. Разделим 200 на 109, а затем возведем результат в степень 1,64 – средний интервал между смертями от удара копытом. Получится 2,71, то есть почти e (с точностью примерно 1 %).
Статистический выброс? Вовсе нет. Это связано с математическими особенностями так называемого распределения Пуассона. Теория вероятностей показывает, что встречу с числом е можно ожидать, когда много событий, обусловленных случайностью, распределено в ограниченном интервале времени. Точно так же происходит и с событиями, разбросанными по ограниченной области пространства. К примеру, число е можно получить, исследуя картину падения "Фау-1" на Южный Лондон во время Второй мировой войны. Хотя мест падения сотни, вероятность того, что случай заставит снаряд упасть на определенный участок британской столицы сравнительно низка. Анализ данных, сходный с предыдущим, дает число 2,69 – опять-таки это почти е (и тоже с точностью около 1 %).
Это справедливо и для частоты войн между странами, и вообще для многих других явлений в человеческой жизни. В каждой конкретной ситуации вероятность события может быть низкой, но оно имеет массу возможностей произойти, и случайность отвечает на это, словно бы заманивая в статистику событий число е.
Случайность способна даже породить данные, из которых можно извлечь, пожалуй, самую знаменитую универсальную константу. Если произвольным образом бросать иголку на деревянный пол, окажется, что число случаев, когда она пересечет щель между какими-нибудь половицами, зависит от геометрических параметров иглы и половиц… и от числа π. Дело в том, что игла каждый раз оказывается на полу под случайным углом по отношению к половицам. Если проделать этот опыт несколько десятков тысяч раз подряд, из этой случайности проступит неожиданно точное значение числа π.
Таких фокусов много. Белого кролика по кличке Пи можно вынуть из любой шляпы, окаймленной случайностью. Соберите большую кучу целых чисел, разбейте их на пары и проверьте, есть ли у каждой пары общий делитель. Вычислите долю таких пар, у которых общего делителя нет, умножьте на 6 и извлеките из произведения квадратный корень. Как показывает одна математическая теорема, по мере роста количества исследуемых пар результат такого вычисления будет все больше приближаться к числу π.
Можно даже задействовать звезды на ночном небе. Достаточно сравнить угловое расстояние между любыми двумя звездами на небесной сфере с угловым расстоянием для любой другой пары. Проделайте это упражнение для 100 самых ярких звезд на небе, и описанный выше метод общего делителя даст вам "небесное π", равное 3,12772: отклонение от истинного значения составляет меньше 0,5 %.
Нам, людям, судя по всему, присуще особое пристрастие к высматриванию осмысленных узоров в случайном – от религиозных фигур в облаках до лиц на Марсе. И мы правы, когда отмахиваемся от большинства из них как от иллюзий. Но иногда случайность может приносить нам сюрпризы, давая узор, который намекает на таящийся во всем порядок.
Жестокий суд
Если вы хотите понять, каковы шансы некоего события (скажем, что ДНК из образца, взятого на месте преступления, идентична ДНК обвиняемого), вам нужно сначала хорошенько изучить законы статистики. Однако в последние годы требования к уликам несколько изменились. Многие полагают, что традиционную статистику не помешает усовершенствовать при помощи одной идеи, взятой из XVIII столетия. Объясняет
Анджела Саини.
Сыщик Коломбо, герой культового американского телесериала, при всей своей мнимой неуклюжести всегда добирается до преступника. Взять хотя бы фотографа светской хроники из серии, вышедшей в 1974 году. Он убил свою жену и представил дело как неудавшееся похищение. Перед вами идеальное преступление – но до тех пор, пока хитроумный детектив не придумает трюк для его разоблачения. Коломбо ставит убийцу в ситуацию, когда тот вынужден схватить с полки, где стоят 12 фотоаппаратов, один-единственный. Негодяй хватает именно тот, с помощью которого снимали жертву перед ее убийством. "Вы только что сами себя изобличили, сэр", – замечает полицейский, присутствующий при этой сцене и внимательно наблюдающий за преступником.
Увы, все не так просто. Даже не будучи убийцей, всякий мог бы случайно выбрать тот же аппарат, шансы здесь – 1 из 12. Такого рода улики не годятся для суда. Или годятся?
Подобные вероятностные ловушки встречаются не только в детективах. "Со статистикой ошибаются до безобразия часто, – говорит Рэй Хилл, математик из британского Сэлфордского университета, в свое время дававший экспертные заключения по нескольким громким уголовным делам. – Я постоянно сталкиваюсь с примерами, когда при работе с уликами и свидетельскими показаниями никто не обращает внимание на эти ошибки".
Основная причина здесь – слишком небрежный анализ вероятностей, который может привести к несправедливому решению, запятнать репутацию суда и даже отправить невиновного за решетку. По мере того как все больше судебных разбирательств полагаются на "совершенно недвусмысленные" данные вроде результатов сопоставления ДНК, проблема становится все более острой. Некоторые математики призывают судей пройти специальный краткий курс, чтобы научиться лучше оценивать истинную значимость представляемых в суде доказательств. Лозунг этих энтузиастов: "Байесовское правосудие – для всех!".
Сей клич побуждает обратиться к работам Томаса Байеса, британского математика XVIII века. Он показал, как вычислять условную вероятность – шансы на то, что нечто является истинным, если его истинность зависит от других утверждений, которые являются истинными. Именно с этой проблемой постоянно сталкиваются суды по уголовным делам, просеивающие доказательства, чтобы определить, виновен ли подсудимый (см. "Правосудие по Байесу").
Похоже, математику следовало бы широко применять в суде: это кажется вполне логичным. Однако судьи и присяжные слишком часто полагаются на интуицию. Вот очень показательный пример: в 1996 году британец Дэннис Джон Адамс предстал перед судом по обвинению в изнасиловании. При опознании среди группы лиц (когда выстраивают нескольких похожих людей, и жертве или свидетелю нужно выбрать одного из них) Адамса не идентифицировали. Его подружка утверждала, что у него алиби. Но его ДНК "с вероятностью 200 миллионов к 1" совпала по генетическому составу со спермой, отобранной на месте преступления. Столь ошеломляющая улика наверняка убедила бы любое жюри присяжных, что он виновен.
Но следует разобраться, что же означает эта цифра. Юристы, присяжные и журналисты часто считают, что в такой ситуации есть лишь один шанс на 200 миллионов, что сперма с места преступления принадлежала не Адамсу, а кому-то другому, а потому его уверения в невиновности показались всем неубедительными. Однако как мы увидим позже, на самом деле это означает: есть один шанс на 200 миллионов, что ДНК любого произвольно выбранного человека совпадет по своему составу с генетическим материалом, отобранным на месте преступления.
Разница трудноуловимая, но очень важная. Возьмем, к примеру, все 10 тысяч мужчин, способных совершить это преступление. Это означает шанс 10 тысяч на 200 миллионов, или 1 на 20 тысяч, что такое совпадение ДНК относится не только к Адамсу, но и к кому-то другому. Ситуация для Адамса не очень утешительная, но все-таки уже совсем не такая безнадежная.
Защита Адамса обеспокоилась, что присяжные могут неверно интерпретировать эти вероятности, и даже обратилась с просьбой вызвать в суд Питера Доннелли, специалиста по статистике из Оксфордского университета. "Мы разработали специальную анкету, чтобы помочь им объединить все доказательства при помощи байесовской логики", – рассказывает Доннелли.
Однако они не сумели убедить присяжных в эффективности байесовского подхода, и Адамса признали виновным. Дважды он подавал апелляцию, и оба раза безуспешно. Приговор не удалось обжаловать, поскольку оба раза судья провозглашал, что работа жюри "состоит в том, чтобы оценивать доказательства не посредством какой-то формулы… а путем совместного использования здравого смысла каждого из присяжных".
А если здравый смысл противоречит истине, справедливости? По мнению Дэвида Люси, математика из британского Ланкастерского университета, приговор Адамсу показывает: в обществе сложилась культурная традиция, которую необходимо срочно менять. "В некоторых делах статистический анализ – единственный способ оценить доказательства, так как интуиция может привести к ошибочным выводам", – подчеркивает он.
Норман Фентон, специалист по информатике из Лондонского университета королевы Марии, не раз сотрудничавший с защитой в уголовных процессах, предлагает решение проблемы. Вместе со своим коллегой Мартином Нилом он разработал целую пошаговую систему схем и древовидных алгоритмов принятия решения. Система должна помочь присяжным усвоить байесовскую логику. Фентон и Нил считают: как только присяжных удастся убедить, что метод работает, экспертам разрешат применять теорему Байеса к фактам, изложенным в деле. Теорему можно воспринимать как своего рода "черный ящик": пусть вы и не понимаете, что происходит у него внутри, зато он позволяет вычислить, как вероятность невиновности или виновности меняется по мере представления каждого очередного доказательства. "Вас же не интересует, какие вычислительные стадии проходит электронный калькулятор, чтобы выдать результат, правда? Почему же вас интересует это здесь?" – спрашивает Фентон.
Предложение спорное. Доведя его до логического предела, можно представить себе судебный процесс, чей исход целиком зависит от одного-единственного вычисления. Когда речь идет о сравнении ДНК или образцов крови, байесовские вероятности работают отлично. Гораздо труднее дать количественную оценку таким инкриминирующим факторам, как внешность или поведение. "Разные присяжные интерпретируют разные улики по-разному. Математик не должен выполнять эту работу за них", – замечает Доннелли.
По его мнению, экспертов-криминалистов следовало бы натаскивать в области статистики, чтобы они могли отслеживать вероятные ошибки в самом начале, практически еще до того, как они действительно будут допущены. После процесса над Адамсом и других подобных дел такое началось и в США, и в Великобритании. Однако адвокаты и присяжные по-прежнему не очень уж сведущи в статистике, а зачастую вообще не имеют никакого понятия об этой науке.
Как показывают пять видов реальных судебных ошибок и погрешностей, приводимые ниже, здесь нет места самоуспокоенности и небрежности. По словам Доннелли, эти юридические примеры очень убедительны. Призывы пересмотреть основы практики статистического анализа объясняются отнюдь не тем, что математики пытаются навязать миру свой образ мышления. "Для справедливого суда нужно научить каждого участника процесса корректно обращаться с неопределенностями", – говорит он.
1. Прокурорская ошибка
"Прокурорская ошибка – погрешность, которую очень легко допустить", – говорит Йен Эветт из Principal Forensic Services, криминологической консалтинговой фирмы, базирующейся в английском графстве Кенте. При этом происходит смешение двух слегка различных вероятностей, которые разграничивает формула Байеса: P (H | E), т. е. вероятности того, что обвиняемый невиновен, если его данные соответствуют улике, и P (E | H), т. е., наоборот, вероятность того, что данные обвиняемого соответствуют улике, если он невиновен. Первая вероятность – то, что мы хотели бы знать. Вторая – то, что нам обычно сообщают эксперты-криминалисты.
К сожалению, даже у профессионалов иногда возникает здесь путаница. На процессе 1991 года, где Эндрю Дина из британского Манчестера обвиняли в изнасиловании, эксперт на основании изучения образца ДНК согласился с тем, что "вероятность того, что источник спермы не Эндрю Дин, а кто-то другой, составляет 1 на 3 миллиона".
Это неверно. Единица на 3 миллиона – вероятность того, что любой невинный человек среди всего населения страны обладает ДНК-профилем, совпадающим с тем, который выявили при анализе спермы, обнаруженной на месте преступления. Иными словами, это P (E | H). Вспомним, что в Великобритании живет около 60 миллионов человек. А значит, такой профиль обнаружится у немалого числа мужчин. Тут многое зависит от того, сколько из них действительно могли бы совершить это преступление. Но все равно вероятность невиновности Дина (хоть его ДНК-профиль и дает соответствие), или P (H | E), гораздо выше, чем "1 на 3 миллиона".
Дина признали виновным. Приговор удалось с блеском обжаловать, что привело к целому потоку сходных апелляций. Результаты оказались разными, иной раз – довольно неожиданными. В 2008 году в тюрьму заключили одного калифорнийца, чья ДНК, как установила полиция, соответствовала образцам, полученным на месте изнасилования и убийства, совершенных за 35 лет до этого.
2. Ошибка конечного вопроса
В деле Дина обвинение едва не превратило свою вероятностную ошибку в окончательный приговор. Однако в сознании присяжных она наверняка превратилась в "ошибку конечного вопроса" (т. е. вопроса о вине, адресуемого присяжным) – в явное и недвусмысленное приравнивание (небольшой) величины P(E | H) и вероятности того, что подсудимый невиновен.
В 1968 году в Лос-Анджелесе ошибка конечного вопроса отправила за решетку Малькольма Коллинза и его жену Джанет. На первый взгляд, обстоятельства дела практически не оставляли места для сомнений: пожилую даму ограбили белая женщина-блондинка и темнокожий усатый мужчина, после чего преступная парочка скрылась на желтой машине. Эксперты подсчитали: шансы найти межрасовую пару, отвечающую этому описанию, составляют 1 на 12 миллионов.
Полицию это убедило. Присяжные тоже не особенно спорили. Они полагали: есть шанс 1 на 12 миллионов, что описание обвиняемой пары не соответствуют описанию преступников. Они полагали: такова же и вероятность ее невиновности.
Они ошибались и в том, и в другом. В таком городе, как Лос-Анджелес, в котором живут и через который проезжают миллионы представителей всевозможных рас, наверняка нашлась бы по меньшей мере еще одна такая пара, и у Коллинзов были бы равные с нею шансы оказаться невиновными (или даже более высокие). Не говоря уж о том, что само описание преступников могло оказаться неточным. Все эти факты помогли успешно обжаловать приговор.
3. Пренебрежение исходной выборкой
Всякий, кто хочет воспользоваться определением ДНК-профиля как быстрой дорожкой для вынесения обвинительного приговора, должен осознавать: генетические доказательства могут быть шаткими. Даже если шансы найти еще одно генетическое совпадение составляют один на миллиард, в мире, где живет 7 миллиардов человек, это означает, что есть еще семь носителей такого же профиля.
К счастью, косвенные и криминалистические доказательства часто довольно быстро сужают группу подозреваемых. Но пренебрежение "исходной выборкой" (всем набором возможных носителей изучаемых совпадений) способно привести к неверным выводам, и не только в зале суда.
Допустим, некто попадает в операционную. У него только что диагностировали смертельную болезнь, которая поражает одного человека из каждых 10 тысяч. Точность диагноза – 99 %. Какова вероятность, что пациент действительно болен этим недугом?
На самом деле она меньше 1 %. Причина этого – сама по себе малая распространенность заболевания, означающая, что даже при диагностике с 99-процентной точностью ложноположительные результаты намного перевешивают истинноположительные (см. схему). Вот почему так важно провести дополнительные исследования, чтобы уменьшить вероятности. Такие результаты, столь противоречащие интуиции, поражают не только непрофессионалов: опросы показывают, что 85–90 % работающих в области медицины также интерпретируют эти вероятности неверно.
Только без паники
Вам поставили диагноз: редкая болезнь, поражающая одного из 10 тысяч. Точность диагноза – 99 %. Надеяться или отчаиваться?
Если точность диагноза – всего 99 %, то 1 % от оставшегося (здорового) населения также даст положительный результат при тестировании:
А значит, если данные тестирования положительны, при прочих равных условиях вероятность того, что у вас нет этой болезни, превышает 99 %. Есть смысл надеяться.
4. Адвокатская ошибка
Не только прокуроры могут выворачивать в свою пользу представляемую в суде статистику. Защитников тоже не раз ловили на избирательном отношении к вероятностям.
В 1995 году О. Джей Симпсон, когда-то считавшийся звездой американского футбола, предстал перед судом по обвинению в убийстве своей жены Николь Браун и ее друга. За несколько лет до этого, во время другого процесса, Симпсон заявил, что не оспаривает обвинение в домашнем насилии против Браун. В попытке сыграть на этом факте Алан Дершовиц, консультант защиты Симпсона, заявил, что в среднем менее чем одна из 1000 женщин, подвергавшихся домашнему насилию со стороны своих мужей или бойфрендов, затем оказывалась убита ими.
Может, и так, но это не самый значимый факт в данном деле, как позже продемонстрировал Джон Аллен Паулос, математик из Темпльского университета (Филадельфия, штат Пенсильвания). Как показывает расчет по байесовскому методу, учитывающий все относящиеся к делу факты, сообщение Дершовица совершенно затмевается 80-процентной вероятностью того, что если женщина подверглась домашнему насилию и затем оказалась убитой, то виновный – ее партнер.
Но, возможно, и это еще не все, замечает криминолог Уильям Томпсон из Калифорнийского университета в Ирвайне. Если более 80 % всех убитых женщин (и подвергавшихся до этого домашнему насилию, и избежавших его) убиты своим партнером, "факты предшествующего домашнего насилия могут вообще не иметь никакой диагностической ценности".