Так было установлено, что ДНК является самой главной молекулой живой природы. Нет, новых законов физики в биологии не обнаружили. Но центральную проблему, проблему строения гена, решить удалось.
Теперь, более полувека спустя, можно констатировать, что открытие структуры ДНК сыграло в развитии биологии такую же роль, как в физике – открытие атомного ядра. Выяснение строения атома привело к рождению новой, квантовой физики, а открытие строения ДНК привело к рождению новой, молекулярной биологии. Но на этом параллель не заканчивается. Чисто теоретические, фундаментальные исследования атома позволили человеку овладеть практически неисчерпаемым источником энергии и радикально изменили нашу повседневную жизнь благодаря компьютеру, Интернету, мобильному телефону. Развитие молекулярной биологии открыло возможность неслыханным образом вмешиваться в свойства живой клетки, направленно изменять наследственность. Это уже начинает оказывать не менее радикальное воздействие на жизнь людей, чем овладение энергией атомного ядра и всеобщее распространение Интернета. Мы уже вступили в век ДНК.
2 От ДНК к белку
Как делается белок
Далекие от науки люди часто ворчат, что, мол, новые теории порождают больше вопросов, чем дают ответов. Это действительно так. Непонятно только, что здесь плохого. В действительности чем больше вопросов порождает новая теория, тем она ценнее. Ведь вопросы-то тоже новые – те, которые никому не приходили в голову, а подчас и не могли быть даже сформулированы до возникновения теории. В этом отношении модели ДНК Уотсона и Крика принадлежит, пожалуй, абсолютный рекорд. История науки едва ли знает еще теорию, которая породила бы столько новых вопросов. И каких вопросов! Они касались самой сути явления жизни. Самый первый и самый главный вопрос был поставлен уже в 1954 году известным физиком-теоретиком Георгием (Джорджем) Гамовым.
Судьба Гамова во многом похожа на судьбу Дельбрюка. Гамов прославился в 1928 году, когда создал теорию альфа-распада, основанную на идее квантового туннелирования. В 1934 году, после нескольких неудачных попыток сбежать из СССР, он наконец, став невозвращенцем из командировки в Европу, сумел покинуть родину и осел в США. Как и в Германии при Гитлере, жизнь в СССР при Сталине стала к тому времени невыносимой. Ближайшие друзья Гамова, блестящие физики Матвей Бронштейн и Лев Ландау, были арестованы во время Большого террора 1937–1938 годов. Бронштейн был расстрелян, а Ландау чудом спасся, проведя год в застенках НКВД в качестве «немецкого шпиона». Ландау был освобожден в значительной степени благодаря беспрецедентному и отчаянно смелому заступничеству другого великого физика, Петра Капицы. (Капица и Ландау впоследствии были удостоены Нобелевской премии.) Если бы Гамов не сбежал, он наверняка тоже попал бы в жернова НКВД.
В 1948 году Гамов выдвинул теорию, согласно которой в начале мироздания был гигантский взрыв, произошедший около 14 миллиардов лет назад. Теория утверждала, что от начального взрыва должно было дойти до наших дней электромагнитное излучение, и предсказывала спектр этого излучения. С легкой руки советского астрофизика И. С. Шкловского предсказанное Гамовым излучение получило название «реликтовое». Поначалу теория Большого взрыва казалась слишком экстравагантной, и мало кто в нее поверил. Но в 1965 году два американских радиоинженера, Роберт Вильсон и Арно Пензиас, случайно обнаружили излучение, равномерно поступающее со всех концов Вселенной, которое обладало всеми свойствами предсказанного Гамовым реликтового излучения. Теория Большого взрыва получила полное признание.
В 1954 году, вскоре после открытия двойной спирали ДНК, Гамов вновь выступил с кардинально новой идеей, на сей раз в области биологии. Как известно, рассуждал Гамов, основными рабочими молекулами в клетке являются белки. Всеми химическими превращениями в клетке ведают белки-ферменты. Почти весь строительный материал клетки также белковой природы. Даже хромосомы лишь наполовину состоят из ДНК, а наполовину – из белка. Значит, работа клетки определяется набором белков в ней.
Отдельная молекула белка может содержать от десятков до нескольких сотен мономерных звеньев. Но если взять все белки клетки и расчленить их на отдельные звенья, то окажется, что наберется всего 20 типов аминокислот. Собственно, разновидностей аминокислот как химических соединений может быть бесчисленное множество, и химики могут, в принципе, синтезировать любые аминокислоты. Но живая природа использует только 20 вполне определенных аминокислот, которые поэтому получили название природных, или канонических. Этот набор из 20 аминокислот абсолютно одинаков, универсален для всей живой природы на Земле. Возьмете ли вы самую ничтожную букашку или самого мудрого корифея, вы обнаружите в них один и тот же набор аминокислот. Чем же отличается букашка от корифея? Отличие заключается в том, какие цепочки образуют аминокислоты. Иными словами, оно сводится к последовательностям аминокислотных остатков в белках.
Чем же определяются последовательности белков? Ответ классической генетики на такой вопрос звучал очень формально: эти последовательности задаются генами. Как именно? Ничего вразумительного классическая, или, как ее еще часто в достаточной степени справедливо называли, формальная, генетика ответить на этот вопрос не могла.
Вот на этот главный вопрос, утверждал Гамов, теперь после работы Уотсона и Крика, имеется четкий и ясный ответ. Аминокислотные последовательности всех белков клетки определяются последовательностью звеньев в одной из двух комплементарных цепочек ДНК. Эти звенья ДНК, называемые нуклеотидами, бывают, как уже говорилось в предыдущей главе, четырех типов (А, Т, Г и Ц). Таким образом, информация о последовательности 20 типов аминокислотных остатков в белках записана в ДНК в виде последовательности нуклеотидов четырех типов. Значит, провозгласил Гамов, клетка должна обладать словарем, переводящим четырехбуквенный текст ДНК в двадцатибуквенный текст белков! Так родилась идея генетического кода.
Тут же возник целый каскад вопросов. Каким образом код реализуется, т. е. где в клетке и при помощи чего происходит перевод ДНКового текста на белковый язык? Как получается, что длинный нуклеотидный текст ДНК дает в конечном счете сравнительно короткие белковые цепи? Наверное, ДНКовый текст состоит из отдельных «предложений», каждое из которых отвечает одному белку? Так, может быть, эти «предложения» и есть гены классической генетики? А что между ними? Что играет роль «точек», разделяющих «предложения»? Иными словами, чем отличаются в физическом, химическом, т. е. в молекулярном, смысле сами гены от промежутков между ними? Ну и наконец, каков же он, генетический код, этот словарь живой клетки?
Небольшая по численности, разбросанная по разным лабораториям мира, но преисполненная боевого духа армия ученых приступила к штурму новых высот. Вел незримые полки Фрэнсис Крик. Он был в те годы признанным лидером среди молекулярных биологов. За период с 1954 по 1967 год на все основные вопросы были получены ответы. Совокупность этих ответов впоследствии стали называть центральной догмой молекулярной биологии. Не все из полученных ответов, казавшихся найденными раз и навсегда, выдержали испытание бурных 1970-х годов. И все же эти ответы, хотя они и перестали быть догмой, и по сей день являются фундаментом, на котором строится все здание молекулярной биологии.
Прежде всего никаких особенностей в химическом строении ДНК, которые отличали бы одни участки от других, обнаружено не было. По всей своей длине молекула ДНК представляет собой непрерывную последовательность нуклеотидных звеньев четырех типов: А, Т, Г и Ц. В этом смысле ДНКовый текст отличается от типографского текста, в котором есть точки, запятые, промежутки между словами. ДНКовый текст – это непрерывная последовательность букв. Роль «знаков препинания» играют сами же буквы. Это особые последовательности нуклеотидов, расположенные между участками, последовательности которых отвечают аминокислотным последовательностям в белках. Отдельный такой участок стали называть геном.
Итак, ген – это часть ДНКового текста, которая содержит информацию об аминокислотной последовательности одного белка. Теперь «элементарная» частица наследственности, о которой спорили когда-то Дельбрюк и Тимофеев-Ресовский, приобрела совершенно конкретный молекулярный, атомный смысл. Оказалось, что ген – вовсе не «неделимая частица», а построен из сотен нуклеотидов. Вот нуклеотиды – это уже действительно элементарные частицы генетического материала – мономерные звенья полимерной молекулы ДНК.
Как же ген порождает белок? Это происходит в два этапа. На первом этапе, который получил название транскрипции, специальный фермент узнает последовательность нуклеотидов, расположенную между генами (эту последовательность называют промотором), и, двигаясь вдоль гена, снимает с него копию в виде молекулы РНК.
Молекула рибонуклеиновой кислоты, что и скрывается за сокращением РНК, весьма сходна по своему химическому строению с молекулой дезоксирибонуклеиновой кислоты, т. е. ДНК. Она тоже представляет собой полимерную цепочку, построенную из мономерных звеньев – нуклеотидов. Как и ДНК, РНК строится из нуклеотидов четырех типов. Их химические формулы, которые, следует признать, выглядят довольно устрашающе, приведены на рис. 6. Чем отличаются нуклеотиды ДНК от нуклеотидов РНК? Для Ц, А и Г это отличие состоит только в том, что в каждом из них самая нижняя и самая правая ОН-группа заменяется в ДНК на Н (отсюда и приставка «дезокси»). Случай уридинового нуклеотида (У) несколько сложнее, так как для него при переходе к ДНК не только происходит замена ОН на Н, но и в шестичленном кольце водород в верхней группе СН заменяется на метильную группу СН3. Этим и объясняется отличие в названиях РНКового нуклеотида (уридиновый) и ДНКового (тимидиновый), хотя они очень похожи друг на друга и оба служат партнерами А при образовании комплементарных пар.
Рис. 6. Полные химические формулы мономерных звеньев РНК-нуклеотидов (известных также под названием нуклеозидмонофосфатов. сокращенно НМФ). Сверху приведены пиримидиновые нуклеотиды (У и Ц). а снизу – пуриновые (А и Г]. Нуклеотиды, входящие в состав ДНК, отличаются тем, что у них вместо правой нижней группы ОН стоит просто Н. Поэтому ДНКовые нуклеотиды называют дезоксинуклеозидмонофосфатами и обозначают как дНМФ. Кроме того, в ДНК вместо уридинового нуклеотида входит тимидиновый, у которого верхняя СН-группа в кольце заменена на группу СНН3
Копирование гена происходит по тому же правилу комплементарности, по которому идет репликация ДНК, только роль, которую играет в ДНК Т, в РНК играет У. Синтез РНК ведется по одной из двух комплементарных цепей гена. Фермент, ведущий синтез, т. е. осуществляющий процесс транскрипции, называется РНК-полимеразой.
Итак, РНК-полимераза снимает с участка длинной молекулы ДНК (с гена) копию в виде матричной РНК (мРНК). Этот РНКовый отпечаток гена используется на втором этапе синтеза белка, в процессе, получившем название трансляция. Собственно, этот этап является решающим, именно здесь вступает в силу генетический код.
Процесс трансляции очень сложен, в нем принимает участие множество действующих лиц. Главное из них – рибосома. Рибосома – это сложнейший агрегат, построенный из полусотни различных белков и молекулы РНК. Имеется в виду не та РНК, которая служит матрицей для синтеза белка на рибосоме, а другая, рибосомальная РНК (рРНК), которая является неотъемлемой частью рибосомы. Чтобы эти два класса РНК отличать друг от друга, рибосомальную РНК обозначают как рРНК, а матричную – мРНК. Рибосома – это молекулярный компьютер, переводящий тексты с нуклеотидного языка ДНК и РНК на аминокислотный язык белков. Этот узкоспециализированный компьютер работает только по одной программе, название которой – генетический код.
Генетический код
На рубеже 1950-х и 1960-х годов Фрэнсис Крик и его сотрудники выяснили основные свойства генетического кода. Было доказано, что код триплетный, т. е. одной аминокислоте соответствует последовательность из трех нуклеотидов на мРНК. Эта тройка нуклеотидов была названа кодоном. Текст, записанный в мРНК, считывается рибосомой последовательно, кодон за кодоном, начиная с некоторого начального инициирующего кодона по следующей схеме:
На этой схеме а0, а1… обозначают аминокислотные остатки белка. Напомним, что их может быть 20 типов. А сколько типов кодонов? Легко подсчитать, что всего существует 43 = 64 различных кодона. Так что же, не всякому кодону соответствует аминокислота? Да, не всякому.
Но таких бессмысленных, или незначащих, кодонов очень немного, и они выполняют специальную функцию – служат стоп-сигналами, обозначают конец белковой цепи. Поэтому их еще называют терминирующими кодонами. Подавляющее же большинство кодонов соответствует какому-либо аминокислотному остатку. А это значит, что код вырожден – большинству, если не всем, аминокислотным остаткам должно отвечать несколько кодонов.
К 1961 году стало ясно, что код триплетный, вырожденный и неперекрывающийся (т. е. считывание происходит кодон за кодоном) и что он содержит инициирующие и терминирующие кодоны. Дело было за тем, чтобы установить соответствие каждого аминокислотного остатка конкретным кодонам и узнать, какие кодоны обозначают начало и конец синтеза белковой цепи. Было совершенно ясно, что именно для этого требуется. Нужно «только» прочесть параллельно два текста – ДНКовый (или РНКовый) текст гена и аминокислотный текст соответствующего этому гену белка. Затем сличить эти два текста – и дело сделано.
Вспомним, что именно так были когда-то расшифрованы египетские письмена. Но беда в том, что если белковые последовательности к этому времени умели расшифровывать, то ни последовательности ДНК, ни последовательности РНК читать не умели. Поэтому пришлось пойти по иному пути.
Представьте себе, что вместо Розеттского камня, на котором один и тот же текст был написан египетскими иероглифами и по-гречески, откопали бы во время наполеоновского похода в Египет живого древнего египтянина. Тогда не потребовался бы гений Шампольона, чтобы составить французско-древнеегипетский словарь. Достаточно было бы показывать египтянину различные предметы, а он рисовал бы соответствующие иероглифы.
Именно этим принципом дешифровки кода и воспользовались американский биохимик и генетик из Национального института здравоохранения Маршалл Ниренберг и его немецкий постдок[1] Генрих Маттеи. Ведь клетки-то знают код! Значит, надо предложить им распознавать разные последовательности нуклеотидов, лишь бы было точно известно, что это за последовательности. К этому времени как раз научились синтезировать кое-какие искусственные РНК (но отнюдь еще не любые!). Ниренберг и Маттеи использовали не живые клетки, а клеточные экстракты, которые сохраняли способность синтезировать белок на РНК. Эти экстракты не умели, разумеется, многого другого, что умеет делать клетка, но важно лишь одно – они были способны синтезировать белок по внесенной извне РНК. Такие экстракты назвали бесклеточной системой.
Ниренберг и Маттеи получили экстракт из кишечной палочки и добавили к нему искусственную РНК, состоящую только из урацилов. Так бесклеточной системе был задан первый вопрос: «Какой аминокислоте соответствует кодон УУУ?» Ответ был однозначен: «Кодону УУУ отвечает фенилаланин». Этот ответ, о котором Ниренберг сообщил на Международном биохимическом конгрессе в Москве в 1961 году, произвел настоящую сенсацию. Путь к расшифровке кода был открыт!
Очень быстро удалось сделать подобный перевод для многих аминокислот. Однако определять последовательность нуклеотидов в искусственных мРНК было довольно трудно. В то время еще не умели синтезировать даже короткие фрагменты с заданной последовательностью. Умели лишь получать полинуклеотиды со случайной последовательностью из смеси мономеров, да и то не из любой смеси. Начали думать, как попытаться иными способами расшифровывать кодоны. Но неожиданно произошел новый прорыв, и ситуация резко изменялась.
Мы видели, что у истоков проблемы кода стоял физик, общие свойства кода были выяснены генетическими методами, после чего за дело взялись биохимики. Окончательно проблема была решена, когда на помощь биохимикам пришли химики-синтетики. Главный вклад внес Хар Гобинд Корана.
К 1965 году Корана научился синтезировать короткие фрагменты РНК с заданной последовательностью – сначала двойки (динуклеотиды), а потом тройки (тринуклеотиды). Из таких двоек и троек с помощью ферментов синтезировали длинные полинуклеотиды, в которых эти двойки или тройки повторялись много-много раз. Затем полинуклеотиды со строго определенной и известной последовательностью добавляли в бесклеточную систему и определяли их соответствие белковым цепям.
А к 1967 году расшифровка генетического кода была окончательно завершена. Этот код изображен на рис. 7. В центральном круге таблицы обозначены первые нуклеотиды кодонов, в следующем – вторые, а затем – третьи. На внешней части круга указаны соответствующие кодонам аминокислотные остатки.
Символ Тер обозначает терминирующие кодоны. А где же инициирующие кодоны? Специальных инициирующих кодонов не существует. Эту роль в определенных условиях играет кодон АУГ, обычно отвечающий аминокислоте метионину.
Даже беглого взгляда на рис. 7 вполне достаточно, чтобы заметить определенную закономерность. Вырожденность кода носит явно не случайный характер; то, какой аминокислоте будет соответствовать данный кодон, определяют главным образом два первых нуклеотида. Каков третий нуклеотид – не так уж важно, т. е., хотя код и триплетный, главную смысловую нагрузку несет дублет, стоящий в начале кодона. Иными словами, код квазидуплетный.