Помимо того, что в 2008 году ДНК-генеалогия прошла проверку на реальных (ископаемых) гаплотипах, показав ту же хронологию, в том же 2008 году, в июне, вышел первый выпуск Вестника, который позже стал международным. В первом выпуске были две больших статьи – "Основные правила ДНК-генеалогии" (54 страницы) и "Происхождение евреев с точки зрения ДНК-генеалогии" (179 страниц). С тех пор вышло 73 выпуска Вестника, общим объемом более 15 тысяч страниц, все выпуски в открытом доступе (http://dna-academy.ru/proceedings/, www.anatole-klyosov.com). Со второго выпуска (июль 2008) в разделе "Обращения читателей и персональные случаи ДНК-генеалогии" публикуются ответы на письма читателей из разных стран мира. До сегодняшнего выпуска опубликованы персональные истории в виде ответов на 249 писем читателей. Авторы Вестника – в основном российские специалисты и любители ДНК-генеалогии, но также специалисты из США, Италии, Франции, Словении, Сербии, Италии, Германии, Бельгии, Шотландии и других стран. Помимо этого, в материалах Академии, которая официально утверждена в федеральных органах РФ в июле 2015 года, публикуются персональные интерпретации гаплотипов и снипов для людей, подавших на рассмотрение данные тестирования своих ДНК.
С того же 2008 года опубликованы 25 научных статей по ДНК-генеалогии в академических журналах (21 на английском языке, одна – в старейшем российском академическом журнале "Биохимия"), и три – в журнале "Исторический Формат") вышли 8 книг по ДНК-генеалогии (7 на русском языке и одна на сербском, в Белграде), и 112 научно-популярных статей по ДНК-генеалогии, из них 80 статей на Переформате – сайте, который выпускается профессиональными историками (http://pereformat.ru/klyosov).
Научные статьи в области ДНК-генеалогии публиковались в журналах Human Genetics (2009), J. Gen. Genealogy (2009), Advances in Anthropology (2011–2014), Биохимия (2011), Eur. J. Human Genetics (2014), Frontiers in Genetics (2014), Исторический Формат (2015). Весной 2013 г. автор настоящей книги получил приглашение быть главным редактором журнала Advances in Anthropology ("Успехи антропологии"), и сделал его профильным журналом по ДНК-генеалогии (наряду, конечно, с публикациями авторов по разным направлениям антропологии). Первой статьей в "Успехах антропологии" была статья по константам скоростей мутаций в гаплотипах Y-хромосомы и их калибровке, то есть количественной связи с хронологией. Концептуально сделать это было несложно, поскольку кинетика химических и биологических мутаций – прямая специальность автора данной книги, он в свое время заканчивал кафедру академика Н.Н. Семенова, единственного лауреата Нобелевской премии среди советских химиков, и написал немало учебников для Высшей школы (в основном издательства Московского университета и издательства "Наука"), часть – со специалистом в области химической кинетики, деканом Химического факультета МГУ чл. – корр. АН СССР И.В. Березиным. За разработку кинетики химических и биологических реакций тот же автор стал лауреатом Государственной премии СССР по науке и технике (1984), а до того – лауреатом премии Ленинского комсомола (1978). Так что концептуально разработать количественную основу ДНК-генеалогии сделать было несложно, но надо было ее верифицировать на тысячах примеров, чтобы она была надежной. Это было сделано с использованием 3160 гаплотипов (2489 из них – в 67-маркерном формате, из 55 ДНК-генеалогических линий из 8 основных гаплогрупп). Эта работа и была опубликована в Advances in Anthropology в 2011 году, во втором выпуске журнала после его основания в том же году.
В последующем в том же журнале были опубликованы статьи с детальным описанием гаплогруппы R1a в мире, гаплогруппы R1a в Европе (с описанием 38 ветвей гаплогруппы R1a), гаплогруппы R1b, ДНК-генеалогии и лингвистики, ДНК-генеалогии и древней керамики от трипольской культуры до культур Юго-Восточной Азии и обеих Америк, а также четыре статьи об Африке и происхождении человека с точки зрения ДНК-генеалогии (две в 2012 г, и две – в 2014 г, одна из них редакторская). Одна статья из этих четырех установила своеобразный рекорд популярности у читателей журнала – по состоянию на 25 октября 2015 года она была просмотрена более 90 тысяч раз, и "скачана" более 20 тысяч раз (http://www.scirp.org/journal/HottestPaper.aspx?Journalro=737).
Описанное выше – это крупный успех нового направления, отражение его признания. Стало ясно, что ДНК-генеалогия фактически является молекулярной историей (см. выше ответы на Вопросы 3 и 4).
Глава 2
Основные понятия и главные положения ДНК-генеалогии
Вопрос 16: Как в Y-хромосоме образуются мутации?
Время от времени при копировании Y-хромосомы в копии проскакивают ошибки. Фермент под названием ДНК-полимераза (на самом деле вместе с целым набором молекулярных инструментов копировальной машины) или просто ошибается и делает некоторые участки ДНК короче или длиннее, удлиняя или сокращая "тандемные повторы" нуклеотидов, или "ремонтирует" повреждённые участки и в ходе "ремонта" удаляет повреждение (эта операция называется "делеция"), или "вшивает" новый нуклеотид (называется "вставка", или "инсерт"). То, что удалось отремонтировать, в мутации не попадает, как будто мутации и не было. Что не удалось – передается сыну при рождении. Если родилась дочь, то Y-хромосома не передается. Если есть только дочери, или детей нет – Y-хромосома терминируется, вместе с мужской наследственной линией.
Мутации, которые интересуют ДНК-генеалогию, бывают двух типов – или изменение числа повторов, тандемов (STR), что описано выше, или "точечные", одно– или несколько-нуклеотидные (SNP), снипы.
Оказалось, что многие повторы нуклеотидов находятся у разных людей в одних и тех же участках Y-хромосомы. Эти участки уже специалистами пронумерованы, классифицированы, сведены в списки. Они получили название "маркеры". Набор маркеров, точнее, повторов в них, называется "гаплотип". Уже известных маркеров – больше тысячи. Они, как правило, одни и те же у всех людей на Земле и отличаются друг от друга только числом повторов, что вызвано теми самыми ошибками ферментов (и других элементов биологического копирования) при копировании из поколения в поколение.
Примеры повторов приведены в ответе на вопрос 14. Ясно, что "мутации", которые приводят к изменению числа тандемных повторов в Y-хромосоме, не есть те "мутации", о которых все имеют представление как о "поломках в генах", например, под воздействием радиации. Мутации, которые рассматривают в гаплотипах, происходят не в генах и не являются "поломками". Это, как объяснено выше – ошибки при копировании ДНК. Они имеют весьма сложную архитектуру, и радиацией не вызываются. Это – не поломка, а координированная перестройка.
Вопрос 17: Что такое "общий предок" выборки носителей гаплотипов, и как мутации могут помочь определить, когда он жил?
Любая группа мужчин, относящихся к одной и той же гаплогруппе и к одному и то же субкладу, а также к любой выборке гаплотипов, образующей ветвь в пределах одного субклада, являются в каждом случае родственниками, и происходят от одного общего предка. Можно привести и обратное определение – если мутация, которая осуществилась в Y-хромосоме, унаследовалась в ДНК потомков, то все эти потомки происходят от одного общего предка, у которого и произошла данная мутация.
В принципе, в любой гаплогруппе и любом субкладе имеется множество групп людей, которые происходят от их общего предка. Например, у двух родных братьев есть общий предок – их отец. Если к ним добавить дядю, то общий предок всех троих – отец дяди и дедушка братьев.
Чем глубже во времени общий предок группы людей, или популяции, в терминах ДНК-генеалогии, тем больше у него потомков. Все потомки наследуют гаплотип их общего предка, но чем дальше во времени отстоит общий предок, тем больше мутаций накапливается в гаплотипах потомков. Приведем простой пример. Допустим, общий предок жил 2500 лет назад, то есть 100 условных поколений назад (в ДНК-генеалогии за условное поколение принимается 25 лет, и константы скоростей мутации вычисляются в расчете на условное поколение протяженностью 25 лет). Если выявить сто потомков этого общего предка, в их 12-маркерных гаплотипах обнаружится примерно 200 мутаций, причем у 14 человек гаплотипы будут одинаковыми, и все 200 мутаций будут неупорядоченно распределены, в разной степени, между оставшимися 86 потомками.
Вот эти одинаковые 14 гаплотипов и представляют собой предковый гаплотип. За прошедшие 100 поколений – чисто статистически – в гаплотипах 86 потомков пройдут мутации, а в гаплотипах 14 потомков мутаций еще не будет. Вот таким образом определяют предковый, или базовый гаплотип.
Проверим представленные выше числа. 200 мутаций в 100 гаплотипах в 12-маркерном формате (константа скорости мутаций в 12-маркерных гаплотипах равна 0.02 мутаций на гаплотип за условное поколение) соответствуют величине 200/100/0.02 = 100 условных поколений, то есть примерно 2500 лет (здесь для простоты не вводится поправка на возвратные мутации, смысл которой будет пояснен в следующей главе). Это – линейный метод расчета времени до общего предка популяции. В то же время согласно логарифмическому методу если из 100 гаплотипов в 12-маркерном формате остались неизменными 14, то это соответствует времени, прошедшему от общего предка популяции, равному [ln(100/14)]/0.02 = 98 условных поколений, то есть примерно тому же времени, рассчитанному с помощью линейного метода.
Из этого примера должно быть понятно, что чем более недавний общий предок, тем большее число идентичных друг другу гаплотипов (или их фрагментов) наблюдается в выборке, и тем надежнее выявляется предковый гаплотип. Если общий предок жил очень давно, то одинаковых гаплотипов в выборке может остаться всего два-три – например, три гаплотипа из сотни 12-маркерных гаплотипов останутся при [ln(100/з)]/0.02 = 175 условных поколений до общего предка, то есть общий предок жил 4375 лет назад (на самом деле больше при учете возвратных мутаций). Когда в серии гаплотипов наблюдаются всего два-три одинаковых гаплотипа, они могут не обязательно быть предковыми, а оказаться одинаковыми случайно, в результате игры неупорядоченных мутаций. Поэтому понятие "предковый" гаплотип лучше не употреблять, за исключением совсем уже явных случаев, и в ДНК-генеалогии вместо "предковый" гаплотип обычно употребляют "базовый".
Итак, общий предок популяции – это предполагаемый носитель "базового", или "предкового" гаплотипа. Время жизни общего предка популяции вычисляется по совокупности гаплотипов его потомков, принимая во внимание число мутаций, накопившееся в популяции, нормированное на гаплотип или на маркер, и константу скорости мутации, или частоту мутации в расчёте на поколение. Расчёты времён жизни общих предков популяций позволяют делать предположения о времени и направлениях миграций популяций в древности, о передвижениях популяций. Поскольку, передвигаясь, популяции оставляли следы в виде материальных признаков, это позволяет проводить интерпретацию археологических данных в отношении носителей этих признаков, их принадлежности к определённым родам и племенам, связанных родственными взаимоотношениями. Аналогично, популяции, передвигаясь, приводили к перемещению языков, диалектов, и определение общих предков и времён их жизни даёт возможность прослеживать динамику языков в отношении соответствующих родов и племён, связанных родственными взаимоотношениями.
Вопрос 18: Можно ли привести примеры предковых гаплотипов, датируемых десятками и сотнями тысяч лет назад? Можно ли выявить гаплотип общего предка всех мужчин на Земле?
"Общий предок всех людей" – понятие скорее концептуальное, чем буквальное, абсолютное. Чем больше накапливается данных, тем понятнее становится, что "общий предок всех людей" теряется среди переплетений ДНК-генеалогических линий, уходящих на сотни тысяч лет вглубь. Поэтому введенное некоторое время назад понятие "хромосомный Адам" не является научным и никогда не было доказано. Интуитивно, такой общий предок возможен, но он, скорее всего, будет "плавающей мишенью".
Понятие "одного предка" можно рассматривать на разных уровнях сложности. Например, древнейшая африканская линия (гаплогруппа А00) имеет общего предка с гаплогруппой R1a примерно 210 тысяч лет назад, то есть оттуда, из такой глубины тысячелетий расходятся гаплотипы современных носителей гаплогруппы A00 и этнических русских гаплогруппы R1a:
13 11 12 10 11 16 10 8 14 14 8 8 8 9 12 11 12 8 12 12 11 11 (А00)
12 12 11 11 11 11 11 8 17 17 8 10 8 12 10 12 12 8 12 11 11 12 (R1a)
Здесь приведены 22 очень "медленных" маркера Y-хромосомы, каждый из которых мутирует раз во многие тысячелетия. Можно подсчитать, что эти гаплотипы разошлись на 26 мутаций, и расчеты, основанные на скорости мутации каждого маркера, показывают, что эти 26 мутаций соответствуют времени жизни их общего предка примерно 210 тысяч лет назад. Но даже беглый взгляд на эти гаплотипы показывает, что ДНК древнейших африканцев и этнических русских, носителей гаплогруппы R1a, не так уж намного различаются, или, скорее, являются принципиально сходными.
Хорошо, а если вместо типичного гаплотипа R1a подставить гаплотип R1b, преобладающей гаплогруппы Западной Европы? Мутации здесь настолько медленные, что в таком формате представления гаплотипа он будет практически одинаков по всей Западной Европе:
11 12 13 11 11 12 11 9 15 16 8 10 8 12 10 12 12 8 12 11 11 12 (R1b)
Мы видим, что при таком разрешении большая часть аллелей (это – числа в гаплотипах) у R1a и R1b одинаковы (совпадают 16 аллелей из 22). Между гаплотипами А00 и R1b – 24 мутации, что снижает возраст общего предка на семь тысяч лет, то есть на 3 %. Это – в пределах погрешности расчетов. Только не стоит строить пропорции, там счет нелинейный.
Можно ли считать, что общий предок человечества жил 200210 тысяч лет назад? Вряд ли, поскольку гаплогруппа А00 была обнаружена всего два года назад, и до этого считали, что общий предок человечества жил 140 тыс. лет назад. Если завтра исследователи найдут новую гаплогруппу, то срок начала человечества опять отодвинется. И он несомненно будет отодвигаться дальше, по мере углубления наших знаний. Уже появилась еще одна реперная точка – это общий предок шимпанзе и человека. У современного шимпанзе из полной хромосомной последовательности удалось определить 16 маркеров Y-хромосомы. Они показаны рядом со значениями аллелей в тех же маркерах Y-хромосомы "усредненного общего предка" человека:
8 15 10 4 5 9 10 5 10 4 4 7 4 4 8 9 (шимпанзе)
11 12 11 11 10 8 10 8 12 10 12 12 12 11 11 11 (человек)
Это оказались еще более медленные маркеры, и 64 мутации (!) между ними помещают общего предка шимпанзе и человека на глубину времен в 4.4 миллионов лет назад. В целом это же дают и антропологические оценки. Что важно – никаких "инопланетян" в создании современного человека не было, вместо этого имеется непрерывный эволюционный путь от общего предка шимпанзе и человека миллионы лет назад к нам, современным людям.
Вопрос 19: Можно ли считать, что все люди – родственники?
Как было отмечено в ответе на предыдущий вопрос, концептуально – да, но детали нам пока неизвестны. Если даже мы не найдем конкретного общего предка всех людей на Земле, как мужчин, так и женщин, но принципиальное сходство гаплотипов позволяет предполагать, что все люди произошли от одного общего предка. Если даже мы сможем найти нескольких, которых не сумеем свести к одному общему предку, все равно – опять интуитивно – он и она должны быть. В общем, дело опять сводится к определениям, как мы понимаем "общего предка".
Этот предок оказался древнее, чем предполагалось раньше. Еще недавно считалось, что он жил примерно 70 тыс. лет назад, потом 120 тысяч, потом 140 тысяч, сейчас он уже уходит глубже 200 тыс. лет назад, постепенно приближаясь к общему предку с неандертальцем 300–500 тыс. лет назад, и, возможно, уйдет еще далее к приматам, миллионы лет назад. Как мы видим, гаплотипы хоть и отдаленно, но в принципе похожи на те, что есть у всех нас. У шимпанзе и у нас – одни и те же маркеры. Следовательно, общий предок был один и тот же, только очень древний. И действительно, геномный анализ показывает, что шимпанзе из зоопарка и любой современный человек, мужчина или женщина, имеют более 95 % совпадений в составе их ДНК, или в числе и положениях мутаций, как ни считать.
Вопрос 20: Насколько различаются гаплотипы у разных популяций? Как связать гаплотипы с субкладами?
Как уже сообщалось выше, гаплотипы изображают в виде числа тандемов, или повторов, по каждому маркеру, выбранному из десятков и сотен. В англоязычной литературе их называют STR, или Short Tandem Repeats. Самый простой и короткий гаплотип из тех, которые рассматривает ДНК-генеалогия, состоит из пяти или шести маркеров. Примеры были показаны выше. Но можно привести и еще -
у этнических русских, славян с Русской равнины (индекс субклада R1a-Z280)
16 12 25 11 11 13,
у скифов из раскопок в Минусинской котловине, с датировками 3800–3400 лет назад (индекс не определяли),
16 12 25 11 11 13
в высших кастах Индии (R1a-Z93-L342.2-L657) точно такая же, как у скифов
16 12 25 11 11 13,
у современных таджиков гаплогруппы R1a
16 12 25 10 11 13
(хотя число 10 там при усреднении практически равно 10.5, и при добавлении гаплотипов может склониться или к 10, или к 11),
у носителей гаплогруппы R1a, наиболее распространенной у пуштунов Афганистана (индекс R1a-Z93-L342.2-Z2124)
16 12 24 11 11 13
у западных славян (индекс R1a-M458-L260)
17 12 25 10 11 13