Глава 8 Мутации и код

В двух последних главах мы просто приняли, что наследственная информация, хранимая в ДНК или РНК, закодирована в них в виде последовательности оснований. Не вдаваясь особенно в детали кода, мы заинтересовались прежде всего тем, как в ходе клеточного деления информация передается от ядра к ядру — это привело нас к схеме репликации ДНК — и, во-вторых, как информация через посредство информационной РНК переносится внутри клетки — из хромосом, находящихся в ядре, в цитоплазму, к рибосомам, где она используется для синтеза цепей со специфической последовательностью аминокислот.

В этой главе мы займемся непосредственно самим кодом, но сначала уделим немного внимания мутациям — этим внезапным изменениям генетического материала, которые ведут к изменениям внешнего вида и функций организма. В свете того, что мы уже знаем, мы, естественно, связываем изменения генетического материала с нарушениями в последовательности оснований ДНК и считаем, что последующие изменения признаков организма обусловлены изменениями в последовательности аминокислот в одном или нескольких его белках. Изменения, вызванные мутацией, иногда едва заметны, а эти, казалось бы, незначительные изменения часто имеют весьма серьезные последствия для организма, в чем мы уже убедились на примере аномальных гемоглобинов. Бывает, что в результате случайной мутации функция белка оказывается полностью нарушенной. В таких случаях организм, как правило, погибает, и тогда мы называем мутацию летальной (смертельной). Хотя и очень редко, но возникают также полезные мутации. Обычно такие мутации в процессе естественного отбора закрепляются в последующих поколениях и служат уже признаками нормальной ДНК.

Какими могут быть мутации? Поскольку мы представляем себе наследственную информацию в виде последовательности оснований ДНК, мы можем рассматривать ее как зашифрованный текст. Тогда мутации будут чем-то вроде обычных опечаток. Я приведу несколько примеров таких опечаток, возможных в самых обычных фразах, встречающихся, скажем, в газетных статьях и объявлениях.

ОЖИДАЕТСЯ ПРОХЛАДНАЯ ПОГОДА С ЗАМОРОЗКАМИ НА ПОЧТЕ.

Опечатку такого рода можно назвать замещением: здесь нужная буква замещена неправильной.

ОТПРАВЛЕНИЕ ПОЕЗДА В ДЕСЯТЬ ЧАСОВ УТРА ПО НЕЧЕСТНЫМ ЧИСЛАМ.

Здесь вставлена лишняя буква; назовем такую ошибку вставкой.

В ДОМЕ КУЛЬТУРЫ СОСТОИТСЯ ОКЛАД НА ТЕМУ.

А тут, наоборот, буква пропущена; такую ошибку принято называть делецией.

ЧЕЛНЫ УЧЕНОГО СОВЕТА ОСВЕЩАЮТСЯ ПО ПОНЕДЕЛЬНИКАМ.

В данном случае часть текста напечатана в обратном порядке (переставлены две соседние буквы), это инверсия.

И наконец, сбой в наборе может породить полную бессмыслицу. Мы будем называть такие ошибки нонсенсами:

ПРОГРАММЫ НАУЧНО-ПОПУЛЯРНЫХ ПЕРЕДАЧ.

ИНРГДХ ГПТ ИЮР УНСМ.

Надо вам сказать, что точно такого же характера опечатки встречаются и в генетическом материале живых организмов, и те названия, которые я им дал, взяты из лексикона генетиков, занимающихся изучением мутаций. В этой главе мы будем вести речь о трех видах мутаций.

Как возникают мутации? В наши дни почти каждый знает, что мутации могут быть вызваны радиацией. К нашему несчастью, мы из собственного опыта знаем о генетических последствиях ядерных взрывов. Среди встречающихся в природе мутаций многие обусловлены слабой радиацией. Действию такой слабой радиации — хотим мы того или нет — мы постоянно подвергаемся. Эта радиация совершенно не связана с испытаниями ядерного оружия. Правда, иногда она тоже обусловлена деятельностью человека. Речь идет, например, о различных рентгенологических обследованиях, радиоактивном излучении. Радиоактивны многие минералы, космические лучи, приходящие к нам из мирового пространства, тоже составляют один из видов радиации. Даже непосредственно в составе нашего тела небольшая доля атомов всегда радиоактивна (так, например, мы все содержим калий, а природный калий всегда слегка радиоактивен).

Мутации могут быть также вызваны химическими соединениями. В частности такое довольно простое соединение, как азотистая кислота, оказывает действие на некоторые основания, превращая, например, цитозин в урацил, что ведет к мутации, которую мы назвали замещением. Соединения другого класса — акридины — могут иногда приводить к появлению в последовательности дополнительного основания (вставки) или, наоборот, к выпадению основания — мутация, названному нами делецией.

Я упоминаю об этом потому, что среди великого множества экспериментов, стоящих за всеми упоминающимися в книге открытиями, изучение мутаций — естественных и искусственных — сыграло, пожалуй, главную роль. В частности мутации сыграли важную роль при изучении генетического кода, которым мы теперь и займемся.

Генетический код можно считать чем-то вроде азбуки Морзе. В азбуке Морзе имеются три символа — точка, тире и пустой промежуток (отделяющий соседние буквы). Код нуклеиновых кислот содержит четыре символа: А, Г, Ц и Т (или в РНК — А, Г, Ц, и У).

Трудность изучения кода состоит в том, что мы не умеем прямо определять последовательность оснований в нуклеиновых кислотах, как это удается сделать для последовательности аминокислот в белках[241]. Если бы мы умели определять последовательность оснований в нуклеиновых кислотах, то тогда можно было бы выделить информационную РНК, ведущую синтез определенного белка, установить последовательность оснований в этой РНК и последовательность аминокислот в белке, а затем выписать обе последовательности рядом, и весь код будет перед нами как на ладони. Но раз мы не можем сделать этого прямо, приходится идти кружным путем.

Прежде всего требуется выяснить «кодовое число», иными словами, узнать, сколько символов необходимо для кодирования одной аминокислоты. В азбуке Морзе кодовое число непостоянно, оно меняется от буквы к букве. Некоторые буквы обозначают одним символом, скажем, одна точка обозначает букву Е (кодовое число равно единице); буква М обозначается двумя символами — тире, тире (кодовое число два). Максимальное кодовое число у буквы Э: оно равно пяти (букву Э обозначают символами точка, точка, тире, точка, точка).

Что касается генетического кода, то здесь нам ясно, что кодовое число должно быть больше двух, так как в противном случае с помощью четырех символов мы могли бы составить только 4 ? 4 = 16 возможных комбинаций. Следовательно, кодовое число должно быть равно по меньшей мере 3; тогда можно получить 4 ? 4 ? 4 = 64 комбинации, а этого более чем достаточно для обозначения 20 аминокислот. Правда, у нас получится 44 лишних комбинации; как быть с ними? Ну, во-первых, код может быть «вырожденым». На научном жаргоне это слово означает, что одной аминокислоте соответствует несколько различных комбинаций, точно так же, как одно и то же лекарство может идти в продажу под разными названиями. А может быть и так, что все лишние 44 комбинации являются «нонсенсами» и ничего не означают. Наконец, эти комбинации могут выполнять роль знаков препинания, обозначать начало или конец синтеза белка. Легко придумать и другие возможности. Все эти варианты следует иметь в виду при обсуждении любого кода. Нужно еще помнить, что один вариант не исключает другого: может существовать вырожденный код, содержащий к тому же несколько «нонсенсов».

Еще совсем недавно не было никаких экспериментальных данных, с помощью которых можно было бы проверить относящиеся к коду теории. Проблема кода представляла неплохую арену, на которой могли пробовать свои силы некоторые очень хорошие математики, ну и просто любители головоломок. Было предложено несколько решений, но если никто не мог поручиться, что хотя бы одно из них правильно, то в ошибочности некоторых из предложенных кодов сомнений не было.

Просто как пример остроумия предложенных ранее кодов приведу код Гамова — одно из первых всерьез предложенных решений. Этот код состоял из перекрывающихся триплетов и имел ту притягательную особенность, что, естественно, приводил к «магическому числу» 20 (аминокислот, как мы знаем, двадцать). Принцип этого кода иллюстрирует рисунок XV.

Рис. XV. Перекрывающийся триплетный генетический код, предложенный Г.А. Гамовым.

Как видно из рисунка, каждое основание служит частью сразу трех триплетов, кодирующих три соседние аминокислоты. Однако легко показать, что предложенная схема не может быть правильной. Если вы чуть внимательнее рассмотрите этот код, то увидите, что он налагает на возможные последовательности аминокислот ряд ограничений. Если этот код верен, то некоторые сочетания аминокислот не должны встречаться ни в одном белке. Однако было показано, что никаких подобных ограничений в действительности не существует. Кроме того, в таком случае точковая мутация, которая состоит в замене одного основания, должна была бы приводить к изменению сразу трех стоящих рядом аминокислот, во всяком случае, не менее чем трех. Но мы уже знаем, что это не так: достаточно напомнить аномальные гемоглобины, в которых изменена только одна аминокислота. Да и вообще аномалии в белках почти всегда сводятся к однократным изменениям последовательности. Следовательно, код Гамова не может служить правильным решением.

Первая аминокислота кодируется первым, вторым и третьим основаниями; вторая аминокислота — вторым и четверым и т. д. Согласной этой схеме возможно 20 независимых комбинаций, соответствующих 20 аминокислотам. Изменение одного основания, например основания Г (выделено жирным шрифтом), приведет к изменению сразу трех последовательно расположенных аминокислот (в нашем примере второй, третьей и четвертой). Код такого типа накладывает ограничения на возможные последовательности аминокислот. Например, за аминокислотой, кодируемой триплетом АТТ, может следовать только та аминокислота, которой соответствует кодовый символ, начинающийся с ТТ. Неперекрывающиеся коды не связаны с подобными ограничениями[242].

Был предложен еще ряд кодов. Но лишь совсем недавно были получены экспериментальные данные, позволяющие судить не только о природе кода, но и о том, какие конкретно комбинации оснований кодируют каждую аминокислоту. Я намерен описать два типа экспериментов: один дает сведения относительно общего характера кода, а другой устанавливает реальные символы и их значение.

Эксперименты, связанные с выяснением природы кода, будет легче понять, если я заранее скажу правильный ответ. Код состоит из неперекрывающихся триплетов оснований и читается с определенного места в одном направлении. Например, последовательность АГЦТТЦЦГТ… следует читать: АГЦ ТТЦ ЦГТ… и так до конца гена. Каждый триплет соответствует одной определенной аминокислоте (серину, фенилаланину, аргинину.). Этот результат был получен при изучении мутантных микроорганизмов, возникающих под действием акридина. Как вы помните, обработка акридиновыми красителями приводит либо к появлению в последовательности дополнительного основания (вставка), либо к пропуску основания (делеция); от случая к случаю происходит то вставка, то делеция.

Особенно просто прояснить этот эксперимент, обратившись к аналогии с азбукой Морзе. Пусть сообщение начинается со слова:

(Чтобы сделать аналогию с кодом ДНК возможно ближе, я специально составил слово из букв, для которых требуются три символа, и выбросил пропуски между буквами.)

Теперь предположим, что где-то в середине случайно произошла вставка, например на седьмом месте появилась лишняя точка. Составляя снова символы в группы по три, прочтем текст:

Как видите, сразу после вставки символы стали читаться неправильно, и все слово превратилось в бессмысленное сочетание букв. Легко сообразить, что и следующие слова постигнет та же участь, и так до конца сообщения. Если, наоборот, в том же месте произойдет делеция, то мы снова прочтем бессмыслицу. Точно так же и в ДНК однократная вставка или делеция делает генетическое сообщение бессмысленным: в синтезируемой последовательности аминокислот с определенного места пойдет брак. Можно заранее предсказать, что белок, синтезируемый под контролем ДНК, которая была обработана таким способом, утратит свою функцию. Если же без этого белка организм не может существовать, то он погибнет — мутация будет летальной. На практике так и случается: однократные вставки и делеции летальны.

А теперь представим себе, что где-то произошла сначала вставка, а потом, чуть позднее, делеция. Как и прежде, сразу после вставки сообщение превратится в бессмыслицу, но после делеции правильное считывание восстановится и снова пойдет осмысленный текст:

Если то же произойдет с ДНК, то в белке появятся только две или три неправильные аминокислоты — во всяком случае, немного (если, конечно, делеция произойдет недалеко от вставки). Затем в последовательности аминокислоты снова встанут на свои места. Хотя такой белок будет работать хуже обычного, но, по крайней мере, можно надеяться, что совсем из игры он не выйдет. И снова предсказания подтверждаются на практике. Однократная делеция или вставка летальна, но две близко отстоящие мутации, из которых одна — вставка, а другая — делеция, хотя и ухудшают жизнеспособность организма, но в ряде случаев не летальны.

По-настоящему решающий эксперимент был выполнен, когда удалось в один участок ДНК ввести сразу три близко расположенные вставки. Как мы видели, одна вставка приводит к появлению бессмыслицы сразу с того места, где она произошла. Можно показать, что и вторая вставка, близкая к первой, даст тот же результат. Иными словами, сообщение становится бессмысленным после первой вставки, но вторая вставка (в отличие от делеции) текста сообщения не восстанавливает:

Если же ввести три вставки, то после третьей вставки смысл текста восстанавливается:

Подобные ситуации были обнаружены при изучении живых организмов. Оказалось, что одна вставка летальна, две — тоже летальны, а три — не летальны, хотя и оказывают вредный эффект, поскольку короткий участок молекулы белка оказывается измененным.

Как легко убедиться, отсюда с очевидностью следует, что кодовое число должно равняться трем: каждая аминокислота кодируется тремя символами. При кодовом числе, равном четырем, для восстановления смысла текста требовались бы четыре вставки. Итак, результаты проведенных экспериментов почти не оставляли сомнений в том, что код должен быть триплетным, неперекрывающимся и должен считываться по три, начиная с некоторой точки, которую можно было бы рассматривать как начало «предложения».

Обратимся теперь ко второй серии экспериментов, имевших целью выяснение действительных кодовых комбинаций. В этих экспериментах использовалась уже упоминавшаяся бесклеточная система. Итак, все компоненты, необходимые для синтеза белка, собраны вместе, в одной пробирке. Сюда входят рибосомы, источник энергии, запас аминокислот, некоторые из транспортных РНК и полный набор необходимых ферментов. Если теперь в пробирку добавить информационную РНК, то начнется синтез белка. Например, можно ввести туда РНК, кодирующую гемоглобин, и в системе начнут в заметном количестве синтезироваться молекулы гемоглобина.

Бесклеточная система, оказавшаяся необычайно полезной при изучении синтеза белка, с неменьшим успехом использовалась и для изучения кода. Было обнаружено, что такая система работает и тогда, когда в нее добавляется искусственный посредник — синтетическая РНК с известной последовательностью оснований. В первом из таких экспериментов в качестве посредника была добавлена синтетическая РНК, состоящая целиком из урацила, и «сообщение» читалось так: УУУУ… Оказалось, что в присутствии такой РНК в системе начинается синтез полипептида, состоящего из единственной аминокислоты — фенилаланина; этот полипептид называют полифенилаланином. Поскольку мы уже знаем, что код триплетный, мы можем сделать вывод, что символ УУУ соответствует именно фенилаланину:

УУУУУУ… ? Фен Фен.

Триплет УУУ был первым расшифрованным символом генетического кода. Этот первый успех побудил исследователей к постановке огромного числа подобных же экспериментов с добавлением в систему других синтетических РНК и анализом полученных полипептидов.

Работа была нелегкой отчасти в связи с тем, что бесклеточная система сама по себе очень сложна и никто как следует не знает, как она работает (иногда она вообще отказывается работать). Кроме того, получать синтетические РНК с нужной последовательностью оснований технически довольно сложно. Хотя это чисто химическая проблема, с ее решением тоже приходится довольно туго. Но вопреки всем этим трудностям удалось выяснить смысл почти всех 64 триплетных комбинаций для перевода кода оснований на язык аминокислот.

Кодовые символы, установленные в опытах с бесклеточной системой и искусственными РНК, могут быть выверены совершенно независимым способом. Чтобы пояснить, какие здесь возможны тексты, обратимся снова к аномальным гемоглобинам, в частности к гемоглобину серповидных клеток. Известно, что в этом гемоглобине один остаток глутаминовой кислоты замещен валином. Далее известно, что совсем другое заболевание крови, распространенное в Западной Африке, связано с замещением в гемоглобине той же самой глутаминовой кислоты на лизин. Наиболее вероятно, что каждое из этих замещений обусловлено мутацией, затрагивающей одно основание хромосомной ДНК. Если это в самом деле так и если наш словарь кодовых слов правилен, то можно с его помощью объяснить превращения:

заменой в каждом случае одного основания ДНК. Обращаясь к рисунку XV, мы замечаем, что такая возможность есть:

Сейчас уже известно довольно много аномалий такого рода, которые могут послужить тестами в аналогичных ситуациях. Почти во всех случаях результаты оказываются в согласии со словарем кодовых символов, приведенным на рисунке XV; следовательно, найденные комбинации далеко не случайны. Нет сомнений в том, что этот словарь, по-видимому, почти полностью правилен, и хотя остается еще несколько неясных мест, я уверен, что в скором времени их не будет.

Мы показали, как искусственные мутации помогли установить природу кода — помогли выяснить, что он составлен из триплетов оснований. Мы увидели также, как эксперименты с бесклеточной системой открыли нам реальные кодовые символы. И хотя многое еще остается неясным, у нас есть все основания рассматривать полученные результаты как подлинный триумф молекулярной биологии. Всего несколько лет назад только необыкновенно смелые люди могли предсказать появление такой таблицы в течение ближайших десяти лет.

Кендрью Дж.

Нить жизни. — М., 1968.