В нашей электронной технологии дискретные ячейки памяти могут находиться только в двух состояниях, традиционно представляемых как 0 и 1, хотя их можно трактовать как «высоко-низко», «включено-выключено», «верх и низ»; главное — что они должны быть чётко отличны друг от друга, и совокупность этих состояний может быть «прочитана» так, чтобы на что-то влиять. В электронной технологии используются самые различные физические среды для хранения нулей и единиц — тут и магнитные носители (ленты и диски), и перфорированные карты и ленты, и электронные «чипы» с большим количеством маленьких полупроводниковых ключей внутри.
Главный носитель данных внутри ивовых семян, муравьёв и всех других живых клеток — не электронный, а химический. В нём используется тот факт, что некоторые молекулы способны к «полимеризации», которая заключается в соединении молекул в длинные цепи неограниченной длины. Существует много разных полимеров. Например, «полиэтилен» представляет собой длинные цепи маленькой молекулы, называемой этиленом; т. е. это полимеризированный этилен. Крахмал и целлюлоза — полимеризированный сахар. Некоторые полимерные цепочки являются цепями, состоящими не из однотипных маленьких молекул (как этилен), а молекул двух или более различных видов. Как только такая гетерогенность появляется в полимерной цепи, так информационная технология на ней становится теоретически возможной. Если в нашей цепи имеются два вида маленьких молекул, одну из которых можно полагать нулём, а другую — единицей, так сразу же на ней оказывается возможно хранить любое количество информации любого вида, лишь бы цепь была достаточно длинна. Специфические полимеры, используемые живыми клетками называются полинуклеотидами. В живых клетках существует два главных семейства полинуклеотидов, кратко — ДНК и РНК. Оба представляют собой цепи маленьких молекул, называемых нуклеотидами. И ДНК и РНК — гетерогенные цепи с четырьмя различными видами нуклеотидов. И конечно, именно это открывает возможность для хранения информации. Вместо только двух состояний, «1» и «0», информационная технология живых клеток использует четыре состояния, которые традиционно представляются как A, T, C и G. В принципе, разница между бинарной информационной технологией двух состояний (ткаой, как компьютерная) и технологией четырёх состояний (таковая для живой клетки), очень невелика.
Как я упоминал в конце первой главы, единственная человеческая клетка располагает информационной ёмкостью, достаточной для хранения трёх или четырёх комплектов Британской энциклопедии, в каждом из которых 30 томов. Я не знаю аналогичной цифры для ивы или муравья, но число будет столь же потрясающим. Информационная ёмкость одной клетки зародыша лилии или одного сперматозоида саламандры достаточна для хранения 60 комплектов Британской энциклопедии. Некоторые виды амёб, несправедливо называемых «примитивными» могли бы хранить в своей ДНК 1 000 комплектов Британской энциклопедии.
Как это ни удивительно, но только примерно 1 процент генетической информации, например, в клетках человека, выглядит фактически используемым: примерно эквивалент одного тома Британской энциклопедии. Никто точно не знает, что там делают остальные 99. В предыдущей книге я предположил, что это может быть «безбилетный пассажир», паразитирующий на трудах 1 процента — эта теория была недавно принята молекулярными биологами под названием «эгоистичной ДНК». ДНК Бактерий примерно в 1000 раз менее ёмка, чем ДНК клетки человека, и, вероятно, используется почти полностью: для паразитов тут слишком мало места. Её ДНК могла бы хранить «только» одну копию Нового Завета!
У современных генных инженеров уже есть технология, позволяющая записать Новый Завет или что-либо подобное в ДНК бактерии. «Смысл» символов в любой информационной технологии произволен, и нет никаких препятствий против сопоставления каких-то комбинаций четырёхбуквенного алфавита ДНК, скажем, триплетов, буквам нашего 26-символьного алфавита (и хватило бы места для букв верхнего и нижнего регистра с 12 знаками пунктуации). К сожалению, для записи Нового Завета в бактерию, человеку потребовалось бы примерно пять столетий, так что я сомневаюсь, что кто-нибудь будет суетиться. Но если б это удалось, то благодаря огромной скорости воспроизводства бактерий, 10 миллионов копий Нового Завета могли бы появляться каждый день! Мечта миссионера — если б только люди умели читать алфавит ДНК. Но увы, буквочки там настолько мелкие, что все 10 миллионов копий Нового Завета могли бы одновременно танцевать на булавочной головке.
Электронная память компьютера традиционно подразделяется на ROM и RAM. ROM расшифровывается как «только читаемая память». Строже говоря, это память, в которую пишут лишь однажды, а читают много раз. Комбинация нулей и единиц в них «прожжена» раз и навсегда при изготовлении. В таком виде они и остаются, не изменяясь, в течение всего срока службы памяти, а прочитана эта информация может любое количество раз. В другой тип электронной памяти, называемой RAM, можно «записывать» (вы скоро привыкните к этому неэлегантному компьютерному жаргону), и можно его читать. Поэтому RAM может делать всё то же самое, что и ROM, и даже больше. Расшифровка аббревиатуры RAM фактически вводит в заблуждение, поэтому я не буду приводить её. Особенность RAM в том, что вы можете поместить любой набор нулей и единиц в его любую часть, какую хотите, и столько раз, сколько вам заблагорассудится. Большая часть памяти компьютера — RAM. Напечатанные мною слова поступают прямо в RAM; программа обработки текстов, управляющая этим процессом, тоже находится в RAM, хотя теоретически её можно было бы прожечь в ROM и впоследствии ни разу не менять. ROM используется для фиксированного репертуара стандартных программ, которые необходимы много раз, и которые вы не можете изменить, даже если бы захотели.
ДНК представляет собой ROM. Её можно читать миллионы раз, но записывать лишь однажды — когда она изначально собирается при рождении клетки, в которой она находится. ДНК в клетках любого индивида «прожжена» и никогда не меняется в течение всей его жизни — кроме очень редких случаев поломок. Однако она может быть скопирована. Она дублируется всякий раз, когда клетка делится. Комбинации A, T, C и G нуклеотидов достоверно скопированы в ДНК каждой из триллионов новых клеток, которые образуются при росте ребёнка. При зачатии нового организма в его ДНК ROM «прожигается», новый и уникальный набор информации, с которым он затем и живёт всю свою оставшуюся жизнь. Этот набор копируется во все его клетки, (кроме репродуктивных клеток, в которые, как мы увидим, копируется случайная половина этой ДНК).
Вся компьютерная память, будь то «ROM» или «RAM» проадресована. Это означает, что позиция каждой ячейки памяти имеет уникальное обозначение — обычно номер; впрочем, это произвольное соглашение. Важно понять различие между позицией в памяти и её содержимым. Каждая позиция памяти называется адресом. Например, первые две буквы этой главы, «За» в этот момент находятся в RAM моего компьютера по адресам с номерами 6446 и 6447; всего компьютер может адресовать до 65536 ячеек RAM. В другое время, содержимое ячеек по этим двум адресам будет другим — ячейка хранит последнее записанное туда содержимое. У каждой ячейки ROM тоже есть адрес и содержимое. Отличие в том, что каждый адрес раз и навсегда связан с его содержимым. ДНК собрана в длинные волокна хромосом, как длинные компьютерные ленты. Вся ДНК в каждой из наших клеток адресована в том же самом смысле, как и компьютерная ROM (точнее — как компьютерная лента). Конкретные номера или названия, используемые нами для маркировки данного адреса, произвольны — как и для компьютерной памяти. Важно, что конкретный адрес моей ДНК точно соответствует такому же адресу в вашей ДНК. Содержимое моей ДНК с адресом 321762 может быть, а может и не быть тем же самым, что и содержимое вашей ДНК по адресу 321762. Но мой адрес 321762 находится в точно том же месте в моих клетках, в каком находится ваш адрес 321762 в ваших клетках. «Место» здесь означает позицию на длине данной хромосомы. Точное геометрическое положение хромосомы в клетке не имеет значения. Хромосома плавает в жидкости, и поэтому её геометрическое положение меняется, но каждый адрес на хромосоме точно определён в понятиях линейного порядкового номера по длине хромосомы — также, как на компьютерной ленте, даже если лента разбросана на полу, а не аккуратно смотана. Все мы, все люди, обладают одними и тем же набором адресов ДНК, но не обязательно тем же самым содержимым их. И это главная причина того, почему мы все отличаемся друг от друга.
У других биологических видов другой набор адресов. Например, у шимпанзе 48 хромосом, а у нас — 46. Строго говоря, сравнивать так содержимое ячеек — адрес за адресом, бессмысленно, потому что у разных видов эти адреса интерпретируются совершенно различно. Однако близкородственные виды, такие, как шимпанзе и люди, имеют такие большие куски последовательно совпадающего содержимого, которые мы можем легко идентифицировать как в основном одинаковые, хотя мы не можем использовать одну и ту же систему адресования для этих двух видов. Главный признак вида — это совокупность особей, имеющих одну и ту же систему адресования своей ДНК. За вычетом нескольких незначительных исключений, все члены вида имеют одинаковое число хромосом, и каждое место на длине каждой хромосомы расположено точно там же у всех других особей вида. У разных особей вида может отличаться содержимое этих адресов.
У других биологических видов другой набор адресов. Например, у шимпанзе 48 хромосом, а у нас — 46. Строго говоря, сравнивать так содержимое ячеек — адрес за адресом, бессмысленно, потому что у разных видов эти адреса интерпретируются совершенно различно. Однако близкородственные виды, такие, как шимпанзе и люди, имеют такие большие куски последовательно совпадающего содержимого, которые мы можем легко идентифицировать как в основном одинаковые, хотя мы не можем использовать одну и ту же систему адресования для этих двух видов. Главный признак вида — это совокупность особей, имеющих одну и ту же систему адресования своей ДНК. За вычетом нескольких незначительных исключений, все члены вида имеют одинаковое число хромосом, и каждое место на длине каждой хромосомы расположено точно там же у всех других особей вида. У разных особей вида может отличаться содержимое этих адресов.
Различия в содержимом адресов у различных особей возникают так (здесь я должен подчеркнуть, что рассказываю про вид с половым размножением, такой, как наш). Наши спермии или яйцеклетки содержат по 23 хромосомы каждая. Каждый адрес в одном из моих спермиев в точности соответствует адресу в любом другом из моих спермиев и в каждой из ваших яйцеклеток (или спермиев). Все другие клетки моего тела содержат 46, т. е. двойной набор. В каждой из этих клеток одни и те же адреса используются дважды. Каждая клетка содержит две 9-х хромосомы и две версии ячейки 7230 в хромосоме 9. Эти версии могут совпадать, а могут и не совпадать — причём как между собой, так и между версиями у других членов вида. 23-хромосомный сперматозоид рождается от соматической клетки с 46 хромосомами, получая при этом только одну из копий каждой адресованной ячейки. Какую именно копию он получает — это уже дело случая. То же самое справедливо и для яйцеклеток. В результате каждый спермий и каждая яйцеклетка оказываются уникальным с точки зрения содержимого ячеек, хотя система адресования остаётся идентичной у всех особей одного вида (с незначительными исключениями, которые нам нет нужды рассматривать). Когда спермий оплодотворяет яйцеклетку, то, конечно, получается полный набор 46 хромосом, и все эти 46 хромосом затем будут продублированы во всех клетках развивающегося эмбриона.
Я говорил, что информацию в ROM нельзя записать (кроме как в момент изготовления), и это также справедливо в отношении ДНК в клетках — если бы не случающиеся иногда хаотичные ошибки в копировании. Но коллективный банк данных, состоящий из ДНК-ROM всего вида может быть, в некотором смысле, созидательно перезаписан. Неслучайное выживание и неслучайный репродуктивный успех особей всего вида эффективно «вписывают» улучшенные инструкции по выживанию в коллективную генетическую память вида — по мере смены поколений. Эволюционное изменения вида в значительной степени состоят из изменений количеств копий каждого из возможных различных содержимых каждой адресованной ячейки ДНК — опять же — по мере смены поколений. Конечно, в данный конкретный момент, в данной особи, все копии ДНК должны быть одинаковы. Но для эволюции имеет значение частота возможных альтернатив содержимого по каждому адресу во всей популяции. Система адресования остаётся той же самой, но статистический профиль содержимого ячеек изменяется от столетия к столетию. Тем не менее, очень-очень редко всё же изменяется и система самого адресования. У шимпанзе 24 пары хромосом, а у нас 23. У нас с ними общий предок, поэтому в какой-то момент, или у нашего предка, или у предка шимпанзе произошло изменение числа хромосом. Или мы потеряли хромосому (две слились), или шимпанзе добавили одну (одна разделилась). Должно быть, имелась, по крайней мере одна особь, у которой было другое число хромосом, чем у её родителей. Бывают и другие случайные изменения во всей генетической системе. Как мы увидим, большие куски генетического кода, могут иногда целиком копироваться в совершенно другие хромосомы. Мы знаем это, потому что около хромосом встречаются разбросанные длинные нити текста ДНК, им идентичные.
Считанная из какой-то ячейки компьютерной памяти информация может быть использована двояко. Или она может быть просто записана куда-нибудь ещё, или она может быть вовлечена в какое-то «действие». Записана куда-нибудь ещё — это означает скопирована. Мы уже знаем, что ДНК с готовностью копируется из одной клетки в другую, и что куски ДНК могут быть скопированы в другой индивидуум, а именно — в ребёнка. С «действием» сложнее. В компьютерах одним из действий может быть выполнение инструкции программы. В ROM моего компьютера, по последовательным адресам с 64489 по 64491, находятся специфический набор нулей и единиц, который, если его интерпретировать как инструкцию, побуждает небольшой громкоговоритель компьютера издавать короткий звуковой сигнал. Вот этот набор — 101011010011000011000000. В нём нет ничего звучащего или шумящего. И ничто в нём не говорит вам, что он окажет этот эффект на громкоговоритель. Он имеет этот эффект только потому, что остальные части компьютера соединены соответствующим образом. Точно так же и наборы четырёхсимвольных кодов ДНК оказывают эффекты, например, на цвет глаз или на поведение, но эти эффекты не присущи кодам ДНК самим по себе. Их эффекты получаются только ходе развития всего эмбриона, на который оказывает влияние наборы кодов и в других частях ДНК. Такое взаимодействие между генами будет главной темой седьмой главы.
Прежде, чем вызвать какое-то действие, символы кода ДНК должны быть переведены (транслированы) на другой носитель. Прежде всего, они транскрибируются (перекодируются) в точно соответствующие им символы РНК. У РНК тоже есть алфавит с четырьмя буквами. Далее символы РНК транслируются в полимер совершенно другого вида, называемый полипептидом или белком, который можно было бы назвать полиаминокислотой, потому что базовые элементы этого полимера — аминокислоты. В живых клетках используются 20 различных аминокислот. Все биологические белки — это цепочки, состоящие из этих 20 строительных кирпичиков. Белки — это цепочки аминокислот, однако большинство их не остаются длинным и прямыми нитями. Каждая цепочка свёрнута в сложный узел, точная форма которого детерминируется порядком аминокислот. Поэтому форма этого узла, для данной последовательности аминокислот, никогда не изменяется. Последовательность аминокислот, в свою очередь, точно определяется порядком следования символов кода по длине ДНК (при посредничестве РНК). Поэтому есть смысл говорить, что трёхмерная скрученная форма молекулы белка определяется одномерной последовательностью символов кода ДНК.
Процедура трансляции обрабатывает знаменитый трёхбуквенный «генетический код». Это — словарь, в котором каждый из 64 (4 x 4 x 4) возможных символов-триплетов ДНК (или РНК) переводятся в одну из вышеупомянутых 20 аминокислот или трактуется как символ «остановки чтения». Таких «знаков пунктуации» типа «остановка чтения» три. Одну и ту же аминокислоту могут кодировать несколько триплетов (как легко предположить из того факта, что триплетов 64, а аминокислот только 20). Весь этот процесс трансляции, от строгой последовательности ДНК ROM до точно инвариантной трёхмерной белковой структуры, — это замечательный подвиг цифровой информационной технологии. Последующие шаги, которые ведут к влиянию генов на тела, несколько менее компьютероподобны.
Каждую живую клетку, даже единственную клетку бактерии, можно уподобить гигантской химической фабрике. Участки ДНК-кода, или гены, проявляют свои эффекты, влияя на положение дел на химической фабрике, и делают они это посредством влияния на трёхмерную форму белковых молекул. Слово «гигантский» может показаться неожиданным по отношению к клетке, особенно если вспомнить, что 10 миллионов бактериальных клеток могли бы уместиться на булавочной головке. Но вспомните, что каждая из этих клеток способна хранить весь текст Нового Завета; кроме того, она содержит гигантское количество изощрённых механизмов. Каждый механизм — это большая белковая молекула, собранная под воздействием специфического участка ДНК. Белковые молекулы, называемые ферментами — это механизмы в том смысле, что каждый из них обеспечивает проведение специфичной для него химической реакции, порождая большие количества специфичного для него химического продукта. Для производства этого продукта он использует сырьё, которые плавает в клетке, и, очень вероятно, является продуктом других белковых механизмов. Чтобы вы имели представление о размерах этих белковых механизмов, скажу, что каждый построен примерно из 6000 атомов, что очень много по молекулярным стандартам. Всего таких аппаратиков в клетке порядка миллиона, и их более 2000 различных видов, каждый из которых специализирован на исполнении специфической операции на этой химической фабрике — клетке. Специфические химические продукты таких ферментов придают клетке её характерную форму и поведение.