Кому мешает ДНК-генеалогия? Ложь, инсинуации, и русофобия в современной российской науке - Анатолий Клёсов 7 стр.



Вопрос 15. После изложения основ ДНК-генеалогии и ее отличий от популяционной генетики, подведите, пожалуйста, итоги по значимости ДНК-генеалогии, о том, как она появилась и какие в этой области Ваши самые значимые публикации.

Итак, речь здесь идет о новой науке, которая только создается, основы которой только закладываются в последние годы. Если точнее, то основы этой новой науки уже созданы, причем стремительно[16], и идет прогрессивное накопление экспериментального материала. Новый материал поступает потоком, ежедневно в базы данных уходят десятки и сотни новых «экспериментальных точек», которые по принципу обратной связи корректируют методологию новой науки, что приводит к уточнению методов расчета.

Имя этой науки – ДНК-генеалогия. Ее экспериментальные данные – это картина мутаций в нерекомбинантных участках мужской половой хромосомы (на самом деле – и в митохондриальной ДНК, но в этой книге речь пойдет в основном о Y-хромосоме, более информативной для исторических исследований), причем картина мутаций как в Y-хромосомах отдельных людей, так и их групп, популяций. Методология новой науки – перевод динамической картины мутаций в хронологические показатели, во времена жизни общих предков популяций, а на самом деле – общих предков древних родов и племен. То есть фактически производится расчет времен, когда в древности жили эти рода и племена[17]. Более того, расчеты показывают, как эти времена меняются от территории к территории, что может указывать на направления древних миграций[18].

Мутации, рассматриваемые в ДНК-генеалогии – это или одиночные (как правило) замены нуклеотидов в ДНК, как, например, аденин на цитозин, или цитозин на тимин, или вставки нуклеотидов, или делеции, или мутации более сложные, при которых ошибка копирующего фермента приводит к переносу в Y-хромосоме целого блока нуклеотидов, тандемного, как его порой называют. Это дает или удлинение серии таких блоков на один (редко – сразу на два-три блока), или их укорачивание. Первые мутации – SNP (Single Nucleotide Polymorphism, или в переводе «одиночные нуклеотидные вариации»), или «снипы», обычно очень стабильны, и их для ДНК-генеалогии отбирают только такие, которые случаются только один раз (два раза – максимум) за историю человечества. Поэтому они являются маркерами родов человечества. Примеры будут даны ниже.

Мутации второго типа – STR (Short Tandem Repeats, или «короткие тандемные повторы») – значительно более быстрые, и происходят в определенных участках, или локусах, или маркерах (это все синонимы) Y-хромосомы ДНК раз в несколько десятков или сотен поколений. Набор этих маркеров составляет гаплотип, примеры гаплотипов будут даны ниже. Гаплотип – это по сути цепочка чисел, показывающих число повторов в определенных маркерах.

Естественно, чем длиннее гаплотип, тем выше вероятность того, что в нем произойдет мутация. Мы уже поясняли выше, что мутация в гаплотипах – это результат ошибки в копировании блоков нуклеотидов, тех самых «коротких тандемных повторов», биологической системой копирования ДНК в клетке. Поскольку этих «коротких тандемных повторов» в Y-хросомоме многие тысячи (выше показано 431 таких повторов, и это только среди 10 миллионов нуклеотидов Y-хромосомы, этот размер определяется методологией исследования; всего же в Y-хромосоме примерно 58 миллионов нуклеотидов, или, точнее, нуклеотидных пар, но не будем здесь вдаваться в излишние подробности). Отсюда можно заключить, что таких «тандемных повторов» в Y-хромосоме может быть примерно 2500, и это, видимо, максимально возможный размер гаплотипа. Каждый «тандемный повтор», то есть маркер, мутирует, то есть копирующая система ошибается при копировании протяженных гаплотипов, с вероятностью примерно 0.00178 раз в поколение при протяженнности поколения 25 лет, или раз в 560 поколений, или раз в 14 тысяч лет. Здесь надо сделать два замечания. Во-первых, эта скорость мутации, раз в 14 тысяч лет – средняя величина, рассчитанная по большому числу маркеров. Чем короче гаплотип, тем реальная скорость мутации более отклоняется от средней величины. Во-вторых, величина поколения в 25 лет в ДНК-генеалогии называется условным поколением, она – сугубо математическая величина. Если кому-то больше нравится брать 30 лет за поколение, то вероятность мутации на 30 лет составит примерно 0.00214, или раз в 468 поколений (по 30 лет), или раз в 14 тысяч лет. Как видим, конечный результат получается точно такой же. Более подробно это будет показано ниже.

Поэтому долгие споры, которые популяционные генетики ведут уже многие десятилетия, а именно, сколько лет брать на поколение, не имеют большого смысла, да ни к чему так и не привели. Они просто не очень знакомы с понятием константы скорости мутации (k), а она в расчетах всегда помножена на протяженность поколения (t). Поэтому протяженность поколения нельзя брать произвольно, как захотим, она завязана на константу скорости мутации. Если взять 25 лет на поколение для одной константы скорости мутации, 30 лет – для другой константы, 20 лет на поколение для еще одной константы, но конечный результат получается один и тот же. Потому что это произведение (kt) калибруется по известным генеалогиям и историческим событиям.

Как было отмечено выше, мутация в каждом маркере в среднем происходит раз в 14 тысяч лет, но в гаплотипах, то есть определенных наборах маркеров, мутации происходят со следующими средними скоростями:

– в 6-маркерном гаплотипе она происходит (на весь гаплотип) в среднем раз в 135 условных поколений, или раз в 3380 лет (в этом коротком гаплотипе маркеры мутируют более медленно, чем в других гаплотипах),

– в 12-маркерном – раз в 50 поколений, или в 1250 лет,

– в 25-маркерном – раз в 22 поколения, или в 550 лет,

– в 37-маркерном – раз в 11 поколений, или в 275 лет,

– в 67-маркерном – раз в 8 поколений, или в 200 лет,

– в 111-маркерном – раз в 5 поколений, или в 125 лет,

– в 431-маркерном гаплотипе – примерно раз в поколение, или, точнее, раз в 33 года.

Ясно, что мутаций в протяженных гаплотипах будет больше, чем в коротких за тот же промежуток времени, и изучение истории популяций, принимая в расчет число мутаций, случившихся со времени жизни общего предка популяции, будет точнее.

Поясним это на простом примере. У автора этих строк есть коллега, родом из Белоруссии, и, как показали исследования, мы с ним принадлежим не только к одному роду, то есть не только к одной гаплогруппе (это будет пояснено ниже), но и к одному славянскому племени. Мы не знаем точно, как оно называлось в древности – поляне, или древляне, или вятичи, или кривичи (а кривичи были как минимум смоленские, изборские и северные), или дреговичи, полочане, ильменские словене, радимичи, северяне, волыняне или бужане, тиверцы, уличи, белые хорваты или какие другие. В ДНК-генеалогии наше племя (или племена) носит название «восточно-карпатская ветвь гаплогруппы R1a», и дальше идут символы, детализирующие восточно-карпатскую ветвь на много уровней, на которые расходилось это племя, продолжая ДНК-линию патриарха племени, то есть сохраняя в своей Y-хромосоме специфические, уникальные мутации патриарха. Естественно, чем древнее жил патриарх, тем больше мутаций накапливается в гаплотипах его потомков по сравнению с его гаплотипом.

Так вот, в 6-маркерном формате наши с коллегой из восточнокарпатской ветви гаплотипы выглядят так:


16 12 24 11 11 13

16 12 25 11 11 13


Между ними – одна мутация, что соответствует 1/0.0074 = 135 → 156 условных поколений, или 3900 лет, то есть наш общий предок жил примерно 3900/2 = 1950 лет назад. Надо отметить, что 6-маркерные гаплотипы весьма неточны, для показа чего и служит этот иллюстративный пример. Здесь 0.0074 мутаций на гаплотип – контанта скорости мутации для 6-маркерных гаплотипов, стрелка – табличная поправка на возвратные мутации[19].


В 12-маркерном формате:


13 24 16 11 11 15 12 12 10 13 11 30

13 25 16 11 11 14 12 12 10 13 11 29


Здесь между двумя гаплотипами уже три мутации, что дает 3/0.02 = 150 → 176 условных поколений, или 4400 лет, то есть общий предок жил примерно 2200 лет назад. Здесь 0.02 мутаций на гаплотип – контанта скорости мутаций для 12-маркерных гаплотипов. Вариация датировок, примерно 13 %, находится в пределах обычной погрешности расчетов, хотя гаплотипы короткие, мутаций мало.


В 25-маркерном формате:


13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16 16

13 25 16 11 11 14 12 12 10 13 11 29 15 9 10 11 11 25 14 20 32 12 15 15 16


Здесь между двумя гаплотипами 9 мутаций (мутации между последними четверками гаплотипов считаются по определенным правилам, для так называемых мультикопийных маркеров, там всего две мутации), что дает 9/0.046 = 196 → 242 условных поколений, или 6050 лет, то есть общий предок жил примерно 3025 лет назад. Здесь 0.046 мутаций на гаплотип – контанта скорости мутаций для 25-маркерных гаплотипов. Вариация датировок по первым трем форматам гаплотипов уже заметна, и достигает 55 % (1950, 2200, и 3025). Может показаться, что чем длиннее гаплотипы, чем древнее общий предок, но это не так. В 37-маркерном формате


13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15

16 16 11 11 19 23 15 16 17 21 36 41 12 11 13 25 16 11 11 14 12 12 10

13 11 29 15 9 10 11 11 25 14 20 32 12 15 15 16 11 11 19 23 15 16 17

19 35 42 13 11


между двумя гаплотипами 14 мутаций, что дает 14/0.09 = 156 → 184 условных поколений, или 4600 лет, то есть общий предок жил примерно 2300 лет назад. Здесь 0.09 мутаций на гаплотип – контанта скорости мутаций для 37-маркерных гаплотипов. Вариация датировок по первым четырем форматам гаплотипов (1950, 2200, 3025, 2300 лет до общего предка) уже начала стабилизироваться.


В 67-маркерном формате


13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16

16 11 11 19 23 15 16 17 21 36 41 12 11 11 9 17 17 8 11 10 8 10 10 12 22

22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 13 25 16 11 11 14

12 12 10 13 11 29 15 9 10 11 11 25 14 20 32 12 15 15 16 11 11 19 23

15 16 17 19 35 42 13 11 11 8 17 17 8 12 10 8 10 10 12 22 22 15 10 12

12 13 8 14 22 21 12 12 11 13 11 11 12 13


между двумя гаплотипами 19 мутаций, что дает 19/0.12 = 158 → 187 условных поколений, или 4675 лет, то есть общий предок жил примерно 2340 лет назад. Здесь 0.12 мутаций на гаплотип – контанта скорости мутаций для 67-маркерных гаплотипов. Вариация датировок по первым пяти форматам гаплотипов (1950, 2200, 3025, 2300, 2340 лет до общего предка) еще более стабилизировалась.


В 111-маркерном формате

13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16

16 11 11 19 23 15 16 17 21 36 41 12 11 11 9 17 17 8 11 10 8 10 10 12 22

22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 31 15 9 15 12 25

27 19 12 12 12 12 10 9 12 11 10 11 12 30 12 14 25 13 9 10 18 15 20 12

24 15 12 15 24 12 23 19 11 15 17 9 11 11 13 25 16 11 11 14 12 12 10 13

11 29 15 9 10 11 11 25 14 20 32 12 15 15 16 11 11 19 23 15 16 17 19

35 42 13 11 11 8 17 17 8 12 10 8 10 10 12 22 22 15 10 12 12 13 8 14

22 21 12 12 11 13 11 11 12 13 31 14 9 15 12 25 27 19 12 12 12 12 10 9

12 11 10 11 11 30 12 14 25 13 9 10 19 15 20 11 23 16 12 15 25 12 23

19 11 15 17 9 11 11


между двумя гаплотипами 26 мутаций, что дает 26/0.198 = 131 → 150 условных поколений, или 3750 лет, то есть общий предок жил примерно 1875 лет назад, в начале нашей эры. Здесь 0.198 мутаций на гаплотип – контанта скорости мутаций для 111-маркерных гаплотипов.

Заметим, что чем длиннее гаплотип, тем более стабилизуется константа скорости мутации в расчете на маркер. Для 67-маркерных гаплотипов она равна 0.12/67 = 0.00179 мутаций на маркер, для 111-маркерных гаплотипов она равна 0.198/111 = 0.00178 мутаций на маркер, и если для 409 маркерных гаплотипов она тоже равна 0.00178 мутаций на маркер, то скорость мутаций равна 0.00178x409 = 0.728 мутаций на весь гаплотип. Проверим это. В 409-маркерных гаплотипах между гаплотипами двух упомянутых коллег 95 мутаций


10 12 15 15 10 10 8 8 9 13 7 8 10 10 13 14 14 15 31 32 11 10 9 9 8 24

17 17 8 8 8 16 22 22 24 21 23 14 16 25 28 15 15 6 11 10 14 15 8 14 11

12 10 11 10 10 11 11 18 10 12 10 7 10 5 8 9 5 5 11 15 8 29 6 7 10 13 11

6 7 7 16 10 11 16 22 23 11 12 12 10 7 12 12 13 7 3 20 18 11 11 8 9 13 13

10 11 22 12 16 13 14 11 11 12 10 12 9 13 9 12 11 12 16 7 14 12 10 9 10

4 7 7 13 13 12 11 9 11 10 11 14 8 4 8 6 11 11 16 9 11 13 19 12 12 9 10 9

9 11 11 9 9 14 14 15 9 7 10 12 14 13 14 14 12 6 32 10 11 16 8 7 17 17 11

11 6 13 12 13 11 10 7 13 12 7 16 11 15 12 13 30 24 11 11 13 12 12 9 11

12 14 11 10 12 12 15 12 12 20 34 8 12 11 15 16 9 10 11 11 12 15 15 16

16 7 14 17 17 11 25 8 8 8 12 8 8 23 11 15 13 11 12 12 10 9 15 15 8 13 8

13 15 12 14 10 11 17 10 9 12 20 17 15 36 21 9 10 13 10 14 39 33 36 9

11 12 12 13 11 10 10 12 12 18 19 13 9 14 44 10 12 8 14 24 9 12 15 8 15

20 11 11 21 11 11 10 10 17 9 9 9 9 8 8 8 8 9 12 8 11 15 10 9 23 11 16 9

16 31 8 20 8 13 12 8 16 10 9 33 27 23 22 10 9 8 23 11 12 11 10 11 10 8

11 14 8 8 20 32 55 7 7 5 9 6 11 11 11 13 9 39 33 7 8 27 7 5 13 7 15 28

25 31 60 18 42 25 24 12 31 22 20 12 12 3 4 14 11 10 12 15 15 10 10

8 8 9 13 7 8 10 10 13 14 14 14 31 32 11 10 9 9 8 24 17 17 8 8 8 8 23

23 24 21 22 15 15 25 28 15 16 6 11 10 13 14 8 14 11 12 10 11 10 11

11 11 18 10 12 11 7 10 5 8 9 5 5 11 16 8 29 6 7 10 13 11 6 7 7 16 10 10

16 22 23 11 11 13 10 7 12 12 13 7 3 19 20 10 11 8 9 13 12 10 11 22 11

15 14 14 11 11 12 10 12 9 12 9 12 12 11 16 7 14 13 10 9 9 4 7 7 13 14

12 11 9 11 10 11 14 8 4 8 6 11 11 16 9 11 13 19 12 12 9 10 9 9 11 11 9 9

9 14 14 14 9 7 10 12 14 13 14 14 12 6 32 10 11 16 8 7 17 17 11 11 6 12

12 14 11 10 7 13 12 7 16 11 14 12 13 29 25 11 11 13 12 12 9 11 12 14 11

10 13 12 14 12 12 20 32 8 12 11 15 15 9 10 11 11 11 12 15 16 15 7 14

17 16 11 25 8 8 8 12 8 8 22 11 14 13 11 12 12 10 9 15 15 8 13 8 13 16

12 15 10 11 17 10 9 12 19 14 15 38 21 9 10 16 10 13 39 34 35 9 11

11 12 13 12 10 10 12 12 17 20 13 9 14 43 12 12 8 14 25 9 12 15 8 15

21 11 11 19 11 11 10 10 17 9 8 9 9 8 8 8 8 9 12 8 11 15 10 9 22 11 16

9 15 32 7 19 8 13 12 8 18 10 9 33 28 23 22 10 9 8 23 11 12 11 10 11

10 8 11 14 8 8 19 32 48 7 7 5 9 6 11 11 11 13 9 39 32 7 8 27 7 5 12 7

15 29 22 31 45 19 42 25 23 12 32 22 20 12 11 3 4 14 11


то есть дистанция между ними равна 95/0.728 = 130 → 149 условных поколений, или 3725 лет, и общий предок жил примерно 1860 лет назад. Это практически полностью совпадает с 1875 лет до общего предка, что рассчитано по 111-маркерным гаплотипам. Но и другие оценки на самом деле находятся в пределах погрешностей расчетов. Давайте рассмотрим это более детально. Если формально рассчитать погрешности, то данные для времени жизни нашего с коллегой общего предка (из восточно-карпатской ветви гаплогруппы R1a) выглядят следующим образом:


6-маркерные гаплотипы, 1950±1950 лет назад

12-маркерные 2200±1290 лет

25-маркерные 3025±1050 лет

37-маркерные 2300±660 лет

67-маркерные 2300±575 лет

111-маркерные 1875±510 лет

409 маркерные 1860±270 лет назад


Все эти данные не противоречат тому, что наш с ним общий предок жил в начале нашей эры, но с укорачиванием гаплотипа погрешность определения растет.

Надо сказать, что здесь даются упрощенные примеры, потому что по двум гаплотипам расчеты обычно не ведут, ведут по десяткам и сотням гаплотипов, если таковые есть в наличии, рассчитывают математические погрешности в определяемых цифрах, и т. д. В таких случаях погрешности расчетов приближаются к плюс-минус 10 % от определяемой величины. Здесь только иллюстрируется принцип расчета.

Ясно, что у протяженных гаплотипов 111-маркерных гаплотипов разрешение лучше (400-маркерные гаплотипы пока крайняя редкость). Но их определять дороже, чем более короткие, поэтому в академических исследованиях, при постоянной нехватке денежных средств, приходится работать с более короткими гаплотипами. Длинные гаплотипы определяют в коммерческих компаниях, обычно персонально, каждый для себя, и передают, как правило, в общественные базы данных. Сейчас в общественных базах данных – сотни тысяч гаплотипов, и базы прирастают многими гаплотипами ежедневно.[20]

Несколько опережая изложение в данной Части, сообщим, что примеры характерных 6-маркерных гаплотипов ветвей гаплогруппы R1a (как правило, славянских ветвей, выходцев с Русской равнины) следующие:

Назад Дальше