Поскольку снипсов в геноме человека довольно много, то было предложено изучать их не только по отдельности, но и группами, в которые объединяются снипсы, расположеные относительно рядом в геноме. Такие наследуемые вместе группы снипсов получили название гаплотипов. Проведенный анализ показал, что число гаплотипов для каждого гена сильно варьирует и может составлять от 2 до 53 (в среднем, по разным оценкам, — от 4 до 14). Было проведено сравнение таких гаплотипов у 21 белого человека, 20 афроамериканцев, 20 человек азиатского происхождения, 18 латиноамериканцев и 3 американских индейцев. В результате не удалось обнаружить вариантов гаплотипов, характерных для той или иной этнической группы. Вместе с тем некоторые варианты чаще встречались у людей, которые родом из одного географического региона.
По оценке ученых компании Genaissance Pharmaceuticals в среднем существует 14 вариаций каждого человеческого гена. Ученые проанализировали 313 генов у большого числа американцев, относящихся к 4 расам. Если в геноме человека присутствует примерно 35 тысяч человеческих генов, следовательно, имеется от 400 до 500 тысяч их вариаций. Обнаружение столь большой амплитуды генетических изменений может потребовать пересмотра традиционных представлений о геноме человека. Сейчас планируется создание каталога гаплотипов каждого человеческого гена. Для этого потребуется проанализировать ДНК у тысяч представителей разных континентов нашей планеты.
Далее мы еще вернемся к вопросу о важности снипсов, когда будем говорить о практических применениях знаний о геноме человека для медицинской геномики и фармакогеномики. Помимо высокой плотности, снипсы имеют очень низкий уровень мутаций на поколение (~10–8), что делает их удобными маркерами для анализа молекулярной эволюции (далее мы поговорим о «молекулярных часах», которые эффективно используются генетиками в геногеографии и эволюционной геномике).
Другой вид полиморфизма генома человека связан с повышенной нестабильностью таких уже упоминавшихся повторов генома, как мини-и микросателлиты. Эта нестабильность проявляется в разном числе повторяющихся элементов в отдельных локусах у разных индивидуумов и приводит к сильному полиморфизму. Уровни нестабильности таких тандемно расположенных повторов значительно отличаются в разных локусах. Особое внимание привлекают к себе гипермутабельные сателлиты. В частности, нестабильность ди-и тринуклеотидных минисателлитов обуславливает так называемые динамические мутации, при которых увеличение числа копий повторяющихся элементов (экспансия) выше некого критического уровня приводит к опухолевому росту клеток и развитию некоторых наследственных нейромышечных заболеваний (миотоническая дистрофия, хорея Хантингтона, болезнь Кеннеди и др.). В результате экспансии число повторяющихся элементов в одном локусе может достигать нескольких тысяч. Например, число тринуклеотидных повторов ЦТГ в гене миотонинпротеинкиназы в норме не превышает 27, а при развитии миотонической дистрофии это число увеличивается обычно в тысячу и более раз. Причины такой нестабильности пока до конца не ясны. Как наиболее вероятный механизм этого явления — «проскальзывание» в ходе репликации ДНК.
Сильная изменчивость мини-и микросаттелитов нашла практическое применение и в так называемой геномной дактилоскопии. Наиболее известный пример ее использования — идентификация останков царской семьи. Подробнее об этом опять же поговорим дальше в специальном разделе.
МОЛЕКУЛЯРНЫЕ ЧАСЫ
Вы говорите — время идет.
Безумцы — это вы проходите.
Талмуд
Достаточно твердо установлено, что большинство из происходящих точечных мутаций в геноме не представляются ни полезными, ни вредными для человека, то есть являются нейтральными. Скачки скорее всего не свойственны эволюции. Частоты возникновения точечных мутаций невысоки (порядка 10–8 на генерацию) и относительно постоянны. Расчеты показывают, что при размере диплоидного генома человека около 7х109 п. н. в нем происходит в среднем 175 новых мутаций на генерацию (25 лет). Накопление мутаций можно сравнить с перетеканием песчинок в песочных часах, которые служат мерой времени. Но на практике ученые применили не песочные, а «молекулярные часы». Поскольку большинство мутаций никак не сказываются на самом организме, они могут спокойно сохраняться в эволюции на протяжении длительного времени. Именно за эти факты и ухватились ученые, когда создавали новый подход, названный «молекулярными часами».
На первом этапе была проведена «юстировка» этих часов. Для этой цели были использованы данные о скорости изменения ДНК разных видов организмов, для которых время расхождения в эволюции было надежно установлено по палеонтологическим и археологическим данным. И только после этого началось «чтение» разных эволюционных глав Энциклопедии человека.
«Молекулярные часы» довольно строго показывают, как часто за миллион лет (в среднем) в ДНК того или иного гена или генома в целом происходят мутации. На этой основе по различиям в ДНК можно судить о том, как давно два разных вида организмов, время возникновения которых не известно, были одним видом, когда произошла их дивергенция, то есть расхождение на две разные ветви эволюции. Таким же путем можно сравнивать человеческие популяции или даже ДНК отдельных людей и судить об общности их происхождения или родственных связях. В частности, по «молекулярным часам» удалось оценить более точно время отделения человека от обезьян. Согласно молекулярной оценке, это произошло примерно 5 млн. лет назад. Это внесло существенную поправку в данные палеонтологов, которые долгое время полагали, что разделение человека и обезьян произошло около 25 млн. лет назад. Массовый анализ митДНК из разных рас показал, что одни митДНК отличаются от других числом замен одних нуклеотидов другими, то есть числом мутаций. Были определены такие показатели, как количество индивидуальных мутаций, их расположение и тип. Эти получившие широкую известность данные выявили общность происхождения всех ныне живущих людей по женской линии. Если читатель не прекратит знакомство с книгой в этом месте, то более подробный рассказ об этих интереснейших исследованиях он найдет далее.
Метод «молекулярных часов», применяемый к ДНКовым текстам, очень похож по своему смыслу на метод глоттохронологии, используемый в лингвистике при установлении родства разных языков. Это специальный статистический метод определения возраста родственных языков, т. е. давности их разделения, по количеству слов, имеющих в этих языках одинаковое происхождение. Ведь язык человека, как и геном человека, все время меняется. Если племя или народ, говорящий на одном языке, по какой-то причине разделится на две части, которые потеряют связь между собой, то язык, как и геном, каждого из этих двух новых племен или народов будет меняться по-своему. Чем больше времени пройдет после разделения двух народов, тем меньше общего сохранится в их языках и геномах, но они по-прежнему останутся родственными. По степени сходства можно судить о том, когда произошло разделение. Лингвисты установили, что за 1000 лет в так называемом базовом словаре (он включает те слова, которые есть в любом языке, — «дом», «земля», «небо», названия частей тела и т. д.) сохраняется 86% слов, т. е. каждый из языков двух народов, обособившихся 1000 лет назад, имеет 86% общих слов с предковым языком. В результате, друг с другом эти языки имеют 74% (86% от 86%) общих слов. При сопоставлении эволюционного древа популяций человека с лингвистическим анализом выяснилось, что в большинстве случаев языки генетически родственных популяций принадлежат к одной лингвистической группе. Вывод ученых гласит: чем раньше разделились две популяции, тем дольше они эволюционировали независимо и тем больше накопилось замен, как в их ДНК, так и в их языках. Конечно, языки напрямую не зависят от генов, и корреляции генетического и лингвистического родства определяются лишь историческими обстоятельствами. Но для нас важно, что здесь одно исследование довольно часто подтверждает другое.
ХРОМОСОМЫ — ОТДЕЛЬНЫЕ ЧАСТИ ЦЕЛОГО
(краткие аннотации)
Природа — единственная книга,
на всех своих страницах заключающая
глубокое содержание.
И. Гёте
Итак, мы уже знаем, что Энциклопедия человека состоит из 24 отдельных томов — хромосом, которые исторически были пронумерованы согласно цитологически измеренному размеру: наибольший размер у хромосомы 1 (том № 1) и наименьший — у хромосомы 22 (том № 22). Хотя со временем выяснилось, что хромосома 22 содержит больше ДНК, чем хромосома 21, порядок нумерации томов не стали менять, чтобы не вносить путаницу. Отдельно идут две половые хромосомы: X и Y (условно их можно назвать томами № 23 и № 24). Разные тома Энциклопедии сильно отличаются друг от друга как по числу страниц (размер ДНКового текста в хромосомах человека варьирует от 50 до 280 млн. п. н.), так и по важности того текста, который в них записан (в первую очередь по числу и свойствам генов). Тем не менее, только совокупность всех хромосом обеспечивает клетки полной информацией, позволяющей человеку нормально развиваться и жить.
В Энциклопедии женщин в норме содержится лишь 23 тома из 24-х, и все они представлены в соматических клетках двумя экземплярами. У мужчин же в клетках содержится вся Энциклопедия человека (все 24 тома-хромосомы), но два из них (хромосомы X и Y) существуют в единичных экземплярах. Это весьма строгое правило. Но, как и любое другое, оно не без исключений. В огромной человеческой популяции встречаются разные варианты. Известно множество хромосомных аномалий, и все они приводят к тяжелым хромосомным болезням человека. Их можно разделить на две группы: вызванные геномными мутациями, т. е. изменением числа хромосом (полиплоидии, анеуплоидии) при сохранении структуры последних, и обусловленные хромосомными мутациями, т. е. изменением структуры хромосомы (транслокации, делеции, инверсии).
В отсутствие любой из пар томов-хромосом в Энциклопедии человека жизнь конкретного индивидуума становится невозможной. Причина понятна — исчезает целостный план-эскиз, необходимый для формирования и/или существования организма. При потере по каким-либо причинам только одной из пары хромосом состояние человека сильно отличается от нормы. Так, например, изредка у людей встречается синдром Шерешевского—Тёрнера, который обусловлен моносомией по X-хромосоме. Этот синдром сопровождается недоразвитием половых органов, низким ростом и рядом врожденных пороков развития. Частичная моносомия хромосомы 5 (потеря части короткого плеча этой хромосомы) приводит к синдрому кошачьего крика. У детей с этой аномалией отмечается необычный плач, что обусловлено изменением гортани, а также черепа и лица. Здесь можно провести такую аналогию. Если в типографии при плохом издании многотомного произведения произойдет потеря лишь одного из томов или только части текста в одной из глав, это сделает издание неполноценным и существенно обеднит его для читателя.
С другой стороны, трудно себе представить, что кто-то, покупая многотомное издание, приобретет какой-то том в двойном количестве. Иногда при издании книг в результате типографических ошибок значительная часть текста повторяется несколько раз, что, безусловно, плохо характеризует издательство и вызывает раздражение у читателя. Такое же «раздражение» возникает и в клетках организма при появлении в нем изредка в силу тех или других причин большего числа томов-хромосом, чем в норме. Вроде бы ничего страшного не произошло — просто определенная информация дублировалась. Но и это чаще всего приводит к серьезным патологиям. Наиболее известная из них — болезнь Дауна, возникающая у людей, содержащих три хромосомы 21 (трисомия) вместо двух. Клинический синдром Клайнфелтера обусловлен трисомией XXY.
В таблице 5 приведены общие сведения о размерах молекул ДНК, содержащихся в отдельных хромосомах, суммарном числе генов в каждой из хромосом и количестве генов, которые к настоящему времени ассоциированы с разнообразными патологиями человека, а также о числе снипсов, о которых мы уже упоминали выше.
Представленные в таблице 5 данные на сегодняшний день отражают хотя и довольно точную, но пока еще некую приближенную к абсолютной ситуацию (до сих пор имеются небольшие отличия при сравнении разных источников и разных баз данных). Предстоит еще полностью закончить секвенирование генома человека, затем необходимо найти и изучить функции всех генов и других элементов генома. Поэтому пока еще нельзя дать полную и окончательную характеристику всех томов Энциклопедии человека. Но тем не менее общий план уже ясен, уже выявлены некоторые хромосомо-специфические моменты, особенности устройства отдельных хромосом.
Одной из целей исследования генома человека являлось построение точной и подробной карты всех этих хромосом. Генетическая карта представляет собой схему, описывающую порядок расположения на хромосоме генов и других генетических элементов-маркеров, а также расстояние между ними. Карты генома, как и географические карты, можно строить в разном масштабе. Максимально возможный уровень разрешения, достигаемый на генетической карте, — один нуклеотид, т. е. одна буква молекулы ДНК. В таком варианте генетическая карта не менее точна, чем, скажем, химическая формула, алгоритм или чертеж. Но для изображения таких карт генома человека требуется несколько сотен тысяч книг.
На рис. 29 изображены карты всех хромосом человека в уменьшенном масштабе, позволяющем наглядно отразить ряд основных параметров, характерных для хромосом: распределение снипсов, распределение установленных и гипотетических генов, расположение повторов, а также количество ГЦ-пар нуклеотидов в разных участках. Если эти карты рассматривать по отдельности, то может сложиться впечатление, что они очень похожи. Но при детальном сравнении выясняется, что на самом деле они существенно отличаются. «Узоры» расположения разных элементов на представленных картах весьма индивидуальны для разных хромосом, их можно сравнить с папиллярными узорами пальцев, которые строго специфичны для каждого человека.
Таблица 5. Общая характеристика хромосом — Из базы данных Ensembl http://www.ensembl.org (октябрь 2002 г.)
Теперь дадим по отдельности краткие аннотации содержанию ДНКовых текстов человека, расположенных в 24 томах-хромосомах. Начнем по порядку, т. е. с самой большой хромосомы под номером 1.
Хромосома 1
Эта наибольшая по физическим размерам и по содержанию ДНК хромосома человека. На ее долю приходится почти 10% генома человека. Поскольку хромосома 1 самая большая, то вполне естественно, что в ней содержится больше всего генов и больше всего снипсов, то есть полиморфных участков. По последним оценкам число генов в этой хромосоме приближается к 3000. Гены и снипсы расположены неравномерно вдоль хромосомы, они практически отсутствуют в области центромеры.
Подавляющая часть снипсов концентрируется в трех участках хромосомы 1. В этой хромосоме имеется множество (порядка 160) генов, связанных с разнообразными заболеваниями человека. Многие из этих болезней едва ли знакомы читателю, но для тех, кто с ними столкнулся в жизни, они являются как правило очень большой бедой. Перечислим лишь некоторые из них, связанные с генами хромосомы 1: болезнь Альцгеймера, нейропатия–2а, болезнь Гоше, синдром Чедиака—Хигаси, рак протоков молочной железы, кардиомиопатия, катаракта, эктодермальная дисплазия, гипотироидизм, острая лимфобластная лейкемия, нейробластома, рак простаты, атеросклероз.
Хромосома 2
Это вторая по размерам хромосома. Наибольшая плотность снипсов имеется в районе центромеры, а вот повторы здесь практически отсутствуют. На единицу длины в ней содержится заметно меньше генов, чем в хромосоме 1 и ряде других хромосом. Тем не менее, число заболеваний, связанных с мутациями в генах этой хромосомы, достаточно большое. Вот некоторые из них: синдром Альстрема, голопрозенцефалия 2, дистрофия большеберцовой мышцы, аутосомно-рецессивная глухота–9, дистрофия мышц конечности 2b, рак прямой кишки, цистинурия, диабет, фиброматозис, гипотироидизм, ожирение, болезнь Паркинсона, тромбофилия, синдром Валленберга, синдром Гилберта и др.