* * *
Эти скромные 1,5 % генома состояли из приблизительно 20,5 тысячи генов, кодирующих белок. Для генетиков и в целом для биологов это было удивительной новостью. На то время весь мир верил в гипотезу Бидла и Татума, по которой один ген кодирует один белок, а значит, генов должно было быть от 80 до 100 тысяч. Оказалось, это бессмыслица. А вслед за ним - другое открытие: по оценке Крейга Вентера, как минимум 40 % этих генов не выполняли никакой известной нам функции. "Мы понятия не имеем, зачем они нужны. Раньше биология о них не знала". Ему пришлось отметить: "Это заставило нас склонить голову".
20,5 тысячи ненужных генов - хочется просто опустить руки. Для сравнения: у нас примерно в 10 раз больше генов, чем у средней бактерии, в 4 раза больше, чем у фруктовой мушки, и всего в 2 раза больше, чем у круглых червей нематод. И у всей этой троицы - человека, мушки и червя - есть 1523 общих гена.
Дарвин был первым, кто осмелился представить, что все живые существа на Земле тесно связаны между собой процессом эволюции, идею которой он предложил. И вот на скрижалях жизни, в человеческой ДНК, мы нашли подтверждение его гениальности - и в то же время новое удивительное несоответствие.
Как наука сможет объяснить, что в 20,5 тысячи генов закодировано примерно 100 тысяч белков?
До этого момента мы считали, что кодирующие белки гены, состоящие из длинных цепочек ДНК, полностью копировались соответствующей информационной РНК - с тем лишь исключением, что четвертый полинуклеотид тимин в ДНК заменяется на урацил в РНК. Эта длинная цепочка соответствующей РНК перемещается из ядра к рибосомам в цитоплазме, которые производят белок. Там, на основе триплетов, РНК транслируется в белки, аминокислоты которых в точности соответствуют исходному генетическому коду ДНК в ядре. По данной гипотезе количество генов должно соответствовать количеству белков.
Ключом к загадке стало ошеломляющее открытие, которое сделали двое ученых в 1977 году.
Ричард Дж. Робертс - выпускник моей альма матер, Шеффилдского университета. Там он получил степень бакалавра наук по химии, закончив докторскую диссертацию в 1965 году. После этого он работал в лаборатории в Колд-Спринг-Харбор, штат Нью-Йорк. Филлип Аллен Шарп - выпускник Иллинойского университета в Нью-Йорке. Он также закончил докторскую в 1965 году и работал в лаборатории в Колд-Спринг-Харбор. Робертс и Шарп исследовали, как гены вируса, называющегося аденовирус 2, кодировали белки в культуре клеток тканей. Ученые выяснили, что информационная РНК, которая у рибосом производила белок, была значительно короче в смысле нуклеотидной последовательности, чем ДНК в ядре вируса. Это подсказало ученым, что только часть так называемых кодирующих белки генов действительно кодировали аминокислоты производимых по их инструкциям белков. При передаче генетического кода из ядра вируса в клетки организмов-носителей, видимо, происходило что-то очень загадочное.
Ситуация такая же, как с исследованиями бактериофагов, самых маленьких из микробов, лет тридцать назад: вирусы открыли нам глаза на более общее биологическое правило. Робертс и Шарп обаружили то, что мы сейчас называем интронами и экзонами, которые очень важны в генетическом механизме сплайсирования. Это открытие принесло им Нобелевскую премию по физиологии/медицине в 1993 году.
Что такое интроны и экзоны? Как они решают вопрос несоответствия между количеством кодирующих белки генов и предполагаемым количеством белков, закодированных в человеческом геноме?
Возможно, настало время вновь вскарабкаться в вагон нашего воображаемого поезда, который отвезет нас в микроскопическую страну по своим удивительным двойным рельсам из фосфатов и дезоксирибозы и не менее удивительным шпалам.
* * *
В мгновение ока мы оказываемся в вагоне - чух-чух-чух - и едем по длинным цепочкам хромосом. Мы знаем, что в этой хромосоме есть определенные участки ДНК, называющиеся генами. Раз уж мы в Волшебной стране и здесь есть место магии, мы можем решить, что следующий ген на наших рельсах будет подсвечиваться зеленым. Зная это, мы замедляемся достаточно, чтобы увидеть впереди участок, пульсирующий изумрудно-зеленым светом, - мы находимся в начале гена. Затем переключаемся на тихий ход и едем вдоль рельсов. Заметно, что светятся зеленым именно шпалы. Через некоторое время они становятся обычного коричневого цвета. И я полагаю, что мы еще не у конца гена: зеленый участок пути, который мы прошли, - просто первый экзон.
И вам хочется спросить: "Где именно мы сейчас находимся?" - "Обычный участок с коричневыми шпалами - это первый интрон".
Мы медленно двигаемся по этому участку и понимаем, что он длиннее предыдущего. Но он внезапно заканчивается, и мы въезжаем на новый зеленый участок - второй экзон. Мы продолжаем путешествие и видим еще три экзона, перемежающихся двумя интронами, как будто пробелами. Все действительно очень просто. Робертс и Шарп поняли, что ДНК отдельного гена не обязательно кодирует один белок. Ген разделен на маленькие участки - экзоны, отделенные друг от друга интронами. Для кодирования одного белка нужно особое сочетание экзонов, а не целый ген, - эти экзоны и копируются в информационную РНК вместе с интронами, однако в процессе кодирования интроны уберутся и экзоны соединятся вместе для получения конечного варианта сообщения, которое передается посредством РНК и кодирует белок.
Будет полезно думать так: экзоны "покидают" ядро, чтобы закодировать белок, а интроны остаются "внутри" ядра. Общее количество экзонов в любом человеческом гене варьируется, но в среднем их 8,4. Следовательно, для кодирования определенного белка геном должен знать, как выбрать нужный ген, а в нем выбрать экзоны, которые придется слепить вместе, чтобы получить нужный код.
Возьмем, к примеру, человеческий бета-глобин - часть молекулы бета-глобулина. Мы знаем, что молекула гемоглобина содержит в своем ядре один атом железа, окруженный двумя первичными и двумя вторичными белковыми единицами. В целом белок состоит из четырех различных частей - такой белок называется четвертичным. Если мы посмотрим на одну из двух одинаковых вторичных белковых единиц, то увидим, что это те же единицы, которые мутируют при серповидной клеточной анемии: мы обнаружим, что участок ДНК, кодирующий этот белок, содержит три экзона и два разделяющих их интрона.
На этом этапе нужно понимать, как активируется ген.
Если бы мы сошли с поезда и посмотрели повнимательнее на участок ДНК, который кодирует бета-гемоглобин, то увидели бы, что где-то ближе к началу первого экзона (помним, что декодирующий механизм движется по молекуле ДНК слева направо) у нас находится секция ДНК, известная как промотор - последовательность, которая обычно присоединяется к началу гена и представляет собой своего рода переключатель, активирующий или подавляющий его. Где-то подальше - может, на вполне значительном расстоянии - есть другие нити ДНК, которые работают как противодействующий регуляторный механизм, офис, полный бюрократов. Бюрократы отдают команду промотору: пора считывать ген. От них зависит, будет ли считан тот или иной ген - а это по-разному происходит в разных клетках, разных тканях и органах человеческого тела. Время экспрессии генов и их количество также зависит от ткани.
Затем промотор отдает команду гену на экспрессию ДНК. Так, в бета-глобине три экзона с разделяющими их интронами превращаются в соответствующую информационную РНК, а после этого (все еще внутри ядра) два интрона удаляются и оставшиеся три экзона соединяются вместе. И только после этого информационная РНК покидает ядро и отправляется к рибосомам в цитоплазме, которые производят белки.
Самый большой известный нам ген человека кодирует необходимый для нормального функционирования мышц белок дистрофин - 79 экзонов, разделенные 78 интронами. Как и в случае анемии, если этот белок затронут мутациями, может возникнуть наследственное заболевание. Например, мышечные дистрофии Беккера и Дюшенна - следствие отсутствия в коде целого экзона, что приводит к повреждению мембраны, окружающей мышечную ткань, и мышцы функционируют неправильно.
Понимание генетических механизмов возникновения таких болезней может помочь ученым-медикам находить лекарства, а в будущем - возможно, недалеком - разработать генетические методы их лечения. То, как работают экзоны и интроны, объясняет, как 20,5 тысячи генов могут кодировать 80–100 тысяч белков.
Ген, в котором, например, есть 14 экзонов и 13 интронов между ними, скорее всего, кодирует более одного белка. Все, что для этого нужно, - регулятивные механизмы, которые решают, какие экзоны слепить воедино, чтобы сделать информационную РНК, выбирая их различные сочетания. Теперь мы знаем, что все работает именно так. Возможность одного гена кодировать разные белки называется альтернативным сплайсингом. Мы также знаем, что эта способность универсальна для эукариотных организмов - всех животных, растений, грибов и простейших, чей геном содержится в ядрах клеток.
Теперь понятно, почему Нобелевский комитет в 1993 году решил отдать премию по физиологии/медицине Робертсу и Шарпу. В 2005 году дорогущая пристройка к химическому факультету Шеффилдского университета, где я когда-то учился, была названа именем Ричарда Дж. Робертса.
* * *
Как мы видим, первая из главных загадок, возникших после расшифровки человеческого генома в 2001 году, уже имела готовую разгадку. Однако еще две из них - обширные сегменты, похожие на вирусный геном, и пустые 50 % - еще только предстоит разгадать. До того как штурмовать новые высоты, нам нужно базовое понимание механизмов, которые могут изменять геномы существующих ныне видов и таким образом создавать новые формы жизни. Это потребует понимания основ эволюционной биологии и многих недавних открытий в этой широкой и очень интересной области науки.
9. Как изменяется наследственность
…Через десяток лет "Происхождение видов" произвели в биологической науке такую же революцию, как "Начала" в астрономии. По словам Гельмгольца, это объясняется тем, что в них содержится "абсолютно новая творческая мысль".
Томас Генри Гексли
Когда в 1859 году Дарвин впервые опубликовал свою теорию эволюции в книге "Происхождение видов путем естественного отбора", она вызвала настоящий шок в цивилизованном мире. Несмотря на то что в книге не было ни слова об эволюции человека, рассуждения о ней сквозили в каждой строке и каждой мысли. Учитывая, что у Дарвина не было реального понимания принципов работы наследственности, его рассуждения и сегодня кажутся провидческими. Он предположил, что природа осуществляет отбор по неким ключевым чертам или характеристикам, которые повышают вероятность выживания, точно так же, как заводчики животных или агрономы проводят отбор по таким свойствам, как размер зерна, качество шерсти, количество мяса, устойчивость к болезням или засухе и т. д. Вот только природный способ этого действия жесток и представляет собой игру на выживание. К примеру, большинство животных оставляют более двух потомков, однако размер популяции остается более или менее одинаковым. Дарвин понял, что эти потомки должны конкурировать друг с другом за скудные ресурсы и избегать хищников. Это приводит к яростной борьбе за выживание, и те, кто получает хотя бы минимальное преимущество с точки зрения неумолимой природы, имеют больше шансов. Если это преимущество определяется наследственностью, выжившие должны передавать его своим потомкам. Со временем (а Дарвин понимал, что это должно быть очень долгое время, в течение которого мелкие изменения будут постепенно накапливаться) таких преимуществ будет становиться все больше и больше, пока, наконец, потомки не станут существенно отличаться от оригинальной родительской линии и не появится новый вид. Размывание наследственных преимуществ уменьшится, если новый вид будет географически изолирован от старого (например, если две популяции будут разделены широкой рекой или горами или одна из них будет жить на острове). Со временем новый вид станет значительно отличаться от первоначальной популяции как физически, так и репродуктивно и не сможет скрещиваться с ее представителями.
Естественный отбор - очень простая и убедительная гипотеза. Дарвин изучал различия в строении клювов птиц на Галапагосских островах, а вскоре другие натуралисты (или биологи, как мы бы сказали сегодня) обнаружили подтверждения его теории в царствах растений, животных, протистов и грибов, а также у гораздо более простых организмов, таких как бактерии и вирусы.
В то время как многие ученые были заинтригованы теорией Дарвина и разделяли ее постулаты, некоторые, например американец швейцарского происхождения Жан Луи Родольф Агассис, изучавший ледники и вымершие виды рыб, полностью отрицали любые революционные идеи по религиозным соображениям. Бывший друг Дарвина сэр Ричард Оуэн, известный натуралист и основатель Музея естественной истории в Лондоне, также часто считается противником эволюции из-за своих религиозных убеждений. Однако, судя по всему, он просто разрабатывал собственные теории и не был согласен с предложенной Дарвином концепцией естественного отбора в сочетании с постепенными изменениями. Дарвин прекрасно понимал, что естественный отбор может работать только при наличии механизмов, способных вносить изменения в наследственность живых организмов. Иными словами, для естественного отбора требуется наследственная изменчивость. Противники теории эволюции в научных кругах появлялись как раз из-за отсутствия понимания природы наследственности. По мнению сэра Джулиана Хаксли (Гексли), правнука знаменитого защитника и соратника Дарвина Томаса Генри Гексли, именно непонимание механизмов наследования подорвало веру в дарвиновскую теорию в научных кругах к концу XIX века. В первых главах своей книги "Эволюция: современный синтез" Хаксли указывает на эту проблему: "Множество критики было обрушено на голову естественного отбора как эволюционного принципа, и вся она затрагивала природу наследственной изменчивости".
Нельзя ставить Дарвину в вину то, что он не смог объяснить механизм наследственной изменчивости, ведь в его время о ней не было известно почти ничего. В своих рассуждениях ученый предполагал, что изменчивость возникает в результате некоего "смешения" наследственности обоих родителей. Первые две главы "Происхождения видов" посвящены действию такого смешения у животных и домашних растений. Но с течением времени Дарвин и сам все меньше и меньше верил в то, что этого объяснения достаточно. Эрнст Майр, один из крупнейших дарвинистов Америки, писал: "Происхождение изменчивости не давало ему покоя всю его жизнь". Сегодня мы понимаем, что под изменчивостью Дарвин имел в виду механизм или механизмы, приводящие к наследственным генетическим или геномным изменениям. Повторное открытие законов наследственности Менделя позволило ученым совершить прорыв в понимании того, как на самом деле работает наследственность. Конкретные черты или характеристики наследуются как дискретные генетические единицы, которые сегодня мы называем генами. В 1990 году голландский ботаник Хуго де Фриз сделал еще один шаг вперед, предположив, что наследственность может изменяться в результате ошибок, возникающих при копировании генов. Очевидно, самым подходящим процессом для возникновения таких ошибок (или, как назвал их де Фриз, мутаций) было размножение.
В 1920–1930-х годах существование мутаций было подтверждено экспериментально эволюционными биологами Томасом Хантом Морганом, Барбарой Макклинток и Германом Дж. Мёллером. Мутация больше не была теоретической возможностью, но превратилась в факт, причем настолько распространенный, что его оказалось возможным предсказать математически. Исследователи со всего света, среди которых были Рональд Эйлмер Фишер и Джон Бердон Сандерсон Холдейн из Британии, Сьюэл Райт и Феодосий Добржанский из США и Сергей Сергеевич Четвериков из СССР, начали работать над математическими моделями проявления естественного отбора через мутации в зародышевых линиях.
Со временем генетики выяснили, что большинство мутаций в последовательностях ДНК, возникающих в процессе формирования яйцеклеток и сперматозоидов человека, не имеют почти никакого влияния на функционирование белков, а значит, и на развитие заболеваний или эволюционный процесс. Мутации, вносившие изменения в строение белков или регулирующую функцию, обычно приводили к отрицательным последствиям, но небольшой процент мутаций изменял наследственность потомства, потенциально увеличивая шансы на выживание. Например, существуют многочисленные доказательства того, что ряд мутаций в гене Prx1 мог привести к удлинению костей передних конечностей летучих мышей, благодаря чему у них могли развиться кожистые крылья.
С медицинской точки зрения мутации в ДНК также могут возникать в ходе деления клеток, которое является обычным элементом процесса обновления органов и тканей в течение жизни организма. Эти так называемые соматические мутации могут вызывать некоторые виды рака - от лейкемии и лимфомы крови и лимфатических узлов до рака груди, кожи, почек, кишечника и т. д. На самом деле все немного сложнее. Геномы эукариотических форм жизни (то есть тех, в клетках которых есть ядра, в том числе растений и животных) имеют механизмы для исправления ошибок по мере возникновения, но эти механизмы иногда дают сбой или оказываются недостаточно эффективными.
Сегодня медицинские генетики могут назвать тысячи мутаций зародшевой линии, которые приводят к возникновению разнообразных врожденных недугов, влияющих на химические процессы в организме потомства. Многие из "ошибок обмена веществ" появляются в результате мутаций отдельных генов, но некоторые вызываются мутациями кластеров генов, отклонениями в отдельных секциях хромосом, утратой или приобретением целой хромосомы. Выше мы уже говорили о том, как рецессивная мутация бета-глобина может привести к развитию серповидно-клеточной анемии. Давайте снова сядем в наш волшебный поезд, посмотрим поближе на геном человека, которому не повезло наследовать доминантную мутацию, и разберемся, как именно она возникла.
Каждую из 46 человеческих хромосом можно представить в качестве отдельной железнодорожной ветки. Поезда могут двигаться по ним от начала к концу, но не могут менять ветки, ведь каждая хромосома представляет собой независимую структуру. Сегодня мы отправимся в дорогу с четвертого пути - по человеческой хромосоме 4. Двигаясь по нему, мы видим участок, перед которым стоит знак с надписью "Гентингтин". Выйдя из вагона и осмотрев пути, мы увидим ту же генную структуру, что и в начале нашего путешествия. Перед нами секция ДНК со шпалами-нуклеотидами, на которой написано, что она является промотором гена гентингтина. Отсюда мы продолжаем двигаться на восток, в "смысловом" направлении, до тех пор, пока не прибудем к первому экзону гена. Проехав еще немного вперед, мы видим что-то странное. Судя по всему, триплет из цитозина, аденина и гуанина (ЦАГ) много раз повторяется в шпалах.
- Ну же, - предлагаю я, - посчитайте количество повторов.