Первая молекула: Как РНК раскрывает главные тайны биологии
Знак информационной продукции (Федеральный закон № 436–ФЗ от 29.12.2010 г.)
Переводчики: Павел Купцов, Мария Багоцкая
Научный редактор: Сергей Киселев, доктор биол. наук
Редактор: Виктория Сагалова
Издатель: Павел Подкосов
Руководитель проекта: Александра Казакова
Художественное оформление и макет: Юрий Буга
Корректоры: Елена Барановская, Елена Воеводина
Верстка: Андрей Ларионов
© Thomas R. Cech, 2024
© Издание на русском языке, перевод, оформление. ООО «Альпина нон-фикшн», 2026
© Электронное издание. ООО «Альпина Диджитал», 2026
Все права защищены. Данная электронная книга предназначена исключительно для частного использования в личных (некоммерческих) целях. Электронная книга, ее части, фрагменты и элементы, включая текст, изображения и иное, не подлежат копированию и любому другому использованию без разрешения правообладателя. В частности, запрещено такое использование, в результате которого электронная книга, ее часть, фрагмент или элемент станут доступными ограниченному или неопределенному кругу лиц, в том числе посредством сети интернет, независимо от того, будет предоставляться доступ за плату или безвозмездно.
Копирование, воспроизведение и иное использование электронной книги, ее частей, фрагментов и элементов, выходящее за пределы частного использования в личных (некоммерческих) целях, без согласия правообладателя является незаконным и влечет уголовную, административную и гражданскую ответственность.
Моим родителям Роберту и Аннетт, которые привили мне любовь к естественным наукам,
а также Кэрол, Эллисон и Дженнифер,
которые сопровождали меня
на этом пути
Введение
Эпоха РНК
Часто говорят, что первая половина XX столетия была эпохой физики. Кривизна пространства-времени, поведение субатомных частиц, Большой взрыв и черные дыры, высвобождение атомной энергии, способной обеспечивать электричеством целые города или стирать их с лица земли. Все эти открытия произвели революцию в науке и изменили нашу повседневную жизнь. Можно сказать, что между 1905 г., когда Эйнштейн вывел формулу E = mc2, и 1947-м, когда в лаборатории Белла был изобретен транзистор, в самой физике произошел Большой взрыв.
В начале второй половины XX в. биология начала вытеснять физику из области всеобщего научного внимания. Говоря «биология», я имею в виду исследования ДНК. Эти полвека начались в 1953 г. с выдающегося открытия, сделанного Джеймсом Уотсоном и Фрэнсисом Криком, описавшими двойную спираль ДНК, а завершились проектом «Геном человека» (1990–2003 гг.), в ходе которого была расшифрована наша ДНК и получен генетический план устройства человечества. Сегодня все знают о важности ДНК: известно, что она содержит нашу генетическую информацию, что с ее помощью можно прослеживать нашу родословную, выявлять наследственные заболевания и раскрывать преступления. Понятие «ДНК» обрело более широкий смысл. Если я говорю вам, что нечто «заложено в моей ДНК», например любовь к горным походам или к тайской кухне, я имею в виду, что мне это свойственно, это часть моей сущности.
В эпоху ДНК широкая общественность в основном не обращала внимания на РНК. Конечно, в учебниках писали (и студенты учили), как с двойной спирали ДНК (дезоксирибонуклеиновой кислоты) образуется РНК-копия (молекула рибонуклеиновой кислоты) и как мРНК, или матричная РНК[1], используется в качестве матрицы для синтеза белков. Но РНК никогда не была в центре внимания. Подобно бэк-вокалистке, она всегда оставалась в тени примадонны.
Со временем представители научного сообщества узнали о других талантах РНК, которые ранее были неочевидны. РНК очень мала, ее размер всего лишь около одного нанометра. Если положить молекулы матричной РНК боком друг к другу, можно уместить 50 000 молекул в пределах толщины одного человеческого волоса. Однако оказалось, что малый размер РНК компенсируется ее универсальностью: складываясь в трехмерные формы, как оригами, она способна проделывать невероятные вещи, тогда как ее сестричка ДНК всегда играет лишь одну и ту же роль.
Действительно, у ДНК одна-единственная роль, хотя и ключевая для всего живого на Земле. ДНК хранит наследственную информацию. И всё. Это как иероглифы в гробнице египетской мумии, или бороздки на виниловой пластинке, или единички и нули, из которых состоят биты информации, содержащейся в компьютере. Задача ДНК – оставаться в ядре клетки и беречь информацию. А чтобы прочитать эту информацию и что-либо с ней сделать, требуются белки и РНК.
Итак, первое, что нужно понять про РНК, – то, что она замечательна своей многоликостью. Да, она может, так же как и ДНК, хранить информацию. Например, многие вирусы, вызывающие заболевания у человека, вообще не заморачиваются с ДНК, их вполне устраивает, что у них гены кодируются (или записаны в молекуле) РНК. Но хранение информации – это всего лишь одна из глав в инструкции по применению РНК. В отличие от ДНК, у РНК в живой клетке много активных ролей. Она может вести себя как фермент, разрезая и склеивая другие молекулы РНК, или собирать из аминокислотных кирпичиков белки – основной материал всех живых организмов. Она поддерживает активность стволовых клеток и предотвращает старение, достраивая ДНК на концах хромосом. Направляя систему редактирования генов CRISPR, она позволяет нам переписать программу организма. Многие ученые считают даже, что РНК хранит тайну появления жизни на нашей планете.
Теперь наконец РНК стала выходить из тени ДНК и раскрывать свой огромный потенциал. Начиная с 2000 г. за открытия, связанные с РНК, было присуждено 11 Нобелевских премий. За тот же период вчетверо выросло число ежегодных научных статей и патентов, связанных с исследованием РНК[2]. В стадии разработки сейчас находится более 400 препаратов на основе РНК[3], и это не считая тех, что уже используются. В одном только 2022 году более 1 млрд долларов из фондов прямых инвестиций было вложено в биотехнологические стартапы, стремящиеся раздвинуть горизонты в изучении РНК[4].
Хотя в прошлом ДНК, возможно, преобладала в биологических исследованиях, в будущем внимание, несомненно, окажется сосредоточено на РНК. XXI век уже стал эпохой РНК, и до конца столетия еще далеко.
Эта книга – путеводитель для образованных людей, показывающий, как РНК оказалась вирусной в прямом и переносном смысле этого слова, как ее изучение превратилась из сложной темы, интересной преимущественно биохимикам, в приоритетное направление, от которого зависит будущее науки и медицины.
Я выступаю в этой истории не как посторонний наблюдатель, а как активный участник. Будучи профессором химии и биохимии Колорадского университета в Боулдере, я изучал РНК на протяжении большей части моей карьеры. Я был свидетелем связанных с РНК открытий, которые заставили ученых в корне поменять представления о том, как зародилась жизнь на планете Земля, и удивительным образом прояснили ряд вопросов, относящихся к здоровью и болезням человека. Одни из этих открытий были собственноручно сделаны мною и моей исследовательской группой. Другие совершены моими близкими друзьями и коллегами, поэтому я вправе называть их по имени.
В совокупности эти касающиеся РНК открытия оказались одним из самых революционных научных достижений со времен описания двойной спирали ДНК. Однако на протяжении многих лет общество не было готово их оценить, потому что люди весьма смутно понимали, что такое РНК и почему она вызывает столь сильное волнение среди ученых. Мне такое отношение всегда казалось обидным, потому что за этим стоят захватывающие истории. Кроме того, граждане финансировали большинство исследований с помощью своих налогов, и они имеют право знать, как окупились потраченные средства.
Неспокойной весной 2020 г. общество столкнулось с РНК, что называется, лицом к лицу весьма неожиданным образом. У меня, как и у многих других, работа была временно приостановлена. Моя лаборатория закрылась, занятия были отменены. Но все вдруг заговорили о моей теме. Мир был охвачен хаосом, созданным SARS-CoV–2, РНК-вирусом, вызывающим заболевание COVID–19. Для борьбы с вирусом были с беспрецедентной скоростью разработаны мРНК-вакцины, и это ошеломляющее достижение оказалось возможным благодаря десятилетиям фундаментальных исследований в области РНК и тем самым открытиям, о которых большинство людей вообще ничего не слышало.
Естественно, общественность захотела узнать об этой молекуле, которая в наши трудные времена стала и причиной проблем, и потенциальным лекарством. Так я превратился из исследователя РНК в рассказчика о РНК. Я поставил себе задачу осветить тему РНК – сначала в процессе публичных выступлений, а теперь в виде книги, которую вы держите в руках.
Мой рассказ об этой молекуле состоит из двух частей. В первой РНК проявляет себя как великий катализатор жизни. Мы начнем с экспериментов 1950-х гг., когда выяснилось, что РНК управляет созданием белков, выполняющих большинство важных функций в живых организмах, от соединения клеток до переваривания пищи. Затем мы увидим, как РНК благодаря удивительному преобразованию, называемому сплайсингом, дает возможность нам, людям, гораздо лучше использовать информацию в нашей ДНК, чем это удается, например, грибам, червям или мухам.
С этого момента история приобретает личный характер. Я расскажу, как моя команда обнаружила каталитические РНК, названные рибозимами. Существование этих веществ нарушало считавшийся незыблемым закон природы, гласящий, что ферменты должны быть белками. Наше открытие привело к получению мной в 1989 г. Нобелевской премии по химии и стало важным поворотным моментом в истории РНК. Теперь в мире науки эту молекулу стали рассматривать не как пассивного посредника и актера с эпизодической ролью в химии жизни, а как звезду всего шоу. Следующей важной задачей было выявить те удивительные формы, которые принимает РНК, творя свои многочисленные чудеса (это захватило даже великого Джеймса Уотсона, после того как он успешно разгадал структуру ДНК). Затем я расскажу, как выяснили, что РНК стоит и за тайным могуществом рибосом – главных молекулярных машин нашей клетки, которые считывают информацию с матричной РНК и используют ее для создания белков, обеспечивающих столь многое в жизни. И, наконец, я покажу, что РНК позволяет решить проблему курицы и яйца и ответить на величайший вопрос науки: как примерно 4 млрд лет назад на Земле зародилась жизнь.
В первой части книги рассказывается, как РНК поддерживает жизнь, а во второй – как РНК может улучшить и продлить жизнь за пределы существующих в природе ограничений. Мы начнем с необычной истории о теломеразе – ферменте, работающем с участием РНК, который научил нас тому, что бессмертие и злокачественные образования в действительности две стороны одной медали. Затем мы узнаем, как крошечные РНК, коммутирующие выключение матричной РНК, могут быть использованы для борьбы с заболеваниями.
Однако РНК не только лечит нас – она может и убивать. В виде РНК хранится генетический материал множества самых смертоносных вирусов, начиная от полиомиелита и заканчивая упомянутым SARS-CoV–2. И хотя у этих вирусов РНК выступает в роли злодея, мРНК-вакцины демонстрируют, что РНК может и прийти на помощь, защищая нас не только от COVID–19, но и, вероятно, от рака и многих других заболеваний.
Наконец, бэк-вокалистка РНК берет реванш над примадонной, работая в системе CRISPR, позволяющей нам изменять саму ДНК. Технология CRISPR уже произвела революцию в фундаментальных научных исследованиях и скоро начнет применяться в медицине и для замедления темпов изменения климата. Оказалось, что универсальность, позволяющая РНК обеспечивать столь много жизненно важных функций в природе, делает ее одновременно и прекрасным инструментом для биомедицинских инженеров, которые сейчас заставляют пересмотреть наши представления о жизни.
Поскольку героиня этой книги присутствует в каждом живом существе на планете и существует уже около 4 млрд лет, я никак не мог рассказать всю историю РНК без сокращений. Я оказался перед сложным выбором: о чем говорить, а что пропустить. Мне также пришлось упростить многие научные понятия, чтобы сделать их более доступными для читателей. Временами я описываю РНК как спагетти и сравниваю реакции сплайсинга РНК с копированием и вставкой слов в текстовом редакторе. Такое упрощение может вызвать раздражение у моих коллег, но, о чем мне часто напоминает моя жена (а она, как и я, биохимик), я пишу книгу не для них.
Предполагаю, что у моих друзей-ученых есть и еще одна причина для неудовольствия. В своем рассказе я стремился сконцентрировать внимание на самой РНК. Поэтому, хотя в моем повествовании упоминаются некоторые исследователи, наткнувшиеся на ключевые открытия или пошедшие по неверному пути, прежде чем им удалось докопаться до истины, я не претендую на полноту изложения. Для каждой научной темы, упомянутой в книге, я постарался указать в примечаниях имена причастных к этому исследователей[5], при этом заранее прошу прощения за то, что, вероятно, многих не назвал. Одна из замечательных особенностей современной науки о РНК – в том, что в процессе совершения большинства открытий принимают участие многие люди, которые непрерывно передают пас друг другу, как в регби. И, так же как в регби, исследователи иногда образуют этакую кучу-малу, и на какое-то время кажется, что мяч потерян. Это состязательная, беспорядочная, порой доставляющая боль игра, но в ней случаются моменты триумфа.
Часть первая
Поиск
Глава 1
Посланник
Прежде чем заняться взломом генетического кода, Георгий Гамов успел решить множество других научных проблем. Он родился в 1904 г. в черноморском портовом городе Одессе и впервые задумался об устройстве Вселенной, когда ему было всего шесть лет, увидев с крыши дома, где жила его семья, комету Галлея. Сорок лет спустя Гамов стал ведущим в мире сторонником теории, согласно которой Вселенная началась с Большого взрыва[6]. Одни коллеги Гамова по науке считали его гением – так, Нильс Бор называл его «еще одним Гейзенбергом»[7], сравнивая с основоположником квантовой механики и лауреатом Нобелевской премии. Другие же видели в нем чудака, «гигантского чертенка, который скачет от атомов и генов к космическим путешествиям»[8], как характеризовал его Джеймс Уотсон.
Гамов выделялся почти двухметровым ростом и специфическим чувством юмора, которое он демонстрировал даже в серьезных научных кругах. Когда он опубликовал теорию о космическом происхождении химических элементов, которую разработал вместе со своим студентом Ральфом Альфером, то неожиданно добавил соавтором своего коллегу Ханса Бете только для того, чтобы перечень «Альфер, Бете, Гамов» соответствовал греческому алфавиту.
В 1933 г. Гамов бежал из Советского Союза, а через год приехал в США. Двадцать лет он был профессором физики в Университете Джорджа Вашингтона, но в конце концов перебрался в мой родной Колорадский университет в Боулдере. В его честь там названо самое высокое здание – Башня Гамова, в которой расположен физический факультет. И хотя Гамов приобрел немалый опыт в области ядерной физики и космологии, в начале 1950-х гг. он пришел к выводу, что самый волнующий научный вопрос, остающийся без ответа, не имеет никакого отношения к происхождению Вселенной и поведению субатомных частиц. Более того, он вообще не имеет отношения к физике.
В июне 1953 г. Гамов прочитал в журнале Nature знаменитую статью Джима Уотсона и Фрэнсиса Крика, утверждавших, что структура ДНК представляет собой двойную спираль. Такая форма молекулы давала ключ к разгадке главной тайны: как наследственная информация удваивается, получая возможность передаваться из поколения в поколение? Каждая нить ДНК на всем своем протяжении состоит из четырех вариантов химических компонентов – нуклеотидов, которые содержат азотистые основания: аденин (А), тимин (Т), гаунин (Г) и цитозин (Ц)[9], формирующих комплементарные пары с основаниями другой нити двойной спирали ДНК. Напротив А всегда находится Т, а напротив Г – Ц.
Две нити двойной спирали ДНК соединены с помощью пар оснований. Участок в середине показан развернутым, чтобы были видны пары А-Т и Г-Ц
Двойная спираль напоминает скрученную застежку-молнию. Если ее расстегнуть, то на каждой стороне будет вся информация, необходимая для воссоздания противоположной стороны, потому что обе стороны точно комплементарны друг другу. Уотсон и Крик предположили, что именно так и происходит удвоение наследственной информации.
Жирным шрифтом показаны материнские нити ДНК, а курсивом – новосинтезированные дочерние
В письме от 8 июля 1953 г. Гамов поздравил Уотсона и Крика с тем, что биология стала частью «точных наук»[10]. Он с ходу предложил сотрудничество между научными областями для решения следующего важного вопроса, который занимал всех: как именно информация, записанная в этих цепочках из А, Т, Г и Ц, считывается, чтобы создавать в итоге руку, сердце, печень или мозг, а также гладкие и морщинистые горошины в саду монаха-августинца Грегора Менделя, первым предположившего, что подобные признаки передаются из поколения в поколение в виде неких отдельных единиц, которые сейчас мы называем генами? Гамов был убежден, что в его силах помочь Уотсону и Крику использовать физику и математику для расшифровки генетического кода.
Уотсон и Крик были польщены вниманием знаменитого физика, но, по воспоминаниям Уотсона, написанное от руки письмо Гамова «было настолько причудливым, что… [они] не поняли, насколько он серьезен»[11]. Но Гамов был очень серьезен. В следующие несколько месяцев он погрузился в расшифровку генетического кода. В то время он был консультантом Военно-морских сил США, поэтому обратился за помощью не только к химикам и физикам, но и к военным криптографам. Оказалось, однако, что для разгадки тайны ДНК нужна была ее дочерняя молекула – рибонуклеиновая кислота, или РНК.
В биологии словосочетание «расшифровать генетический код» означает «понять, как ДНК кодирует белки». Жизнь построена из белков, они главные «воротилы» во всех живых организмах нашей биосферы. У человека некоторые белки выполняют структурную функцию: из них состоят мышечные волокна, кожа и волосы. Некоторые белки работают как ферменты, расщепляя пищу, которую мы едим, на отдельные компоненты и потом используя их для постройки новых клеточных систем. Некоторые образуют отверстия в оболочке клетки, и через эти отверстия одни ионы или питательные вещества могут проникать внутрь клетки, а другие – выбрасываться наружу. Некоторые работают как сигнальные молекулы: они получают информацию из внешнего мира и активируют соответствующие внутренние процессы. Еще есть белки-антитела, защищающие нас от чужеродных захватчиков, таких как вирусы. Короче, белки поражают своим разнообразием.
С точки зрения химии белки – линейные полимеры, состоящие из сотен и даже тысяч аминокислот. Таких аминокислотных составляющих существует 20 видов, у каждого из них свое название, например: лизин, валин, фенилаланин. Для каждого белка характерна своя последовательность аминокислот, соединенных в цепочку[12]. От этой последовательности зависит, какую по форме трехмерную структуру примет белок, чтобы выполнять свою конкретную функцию, например участвовать в переваривании пищи в желудке или в передаче сигнала между нервными клетками в мозге. Таким образом, когда мы слышим, что надо есть рыбу, сыр тофу или бургеры из сои, чтобы «обеспечить достаточно белка в рационе», речь идет не об одном белке, а как минимум о тысяче различных белков. И каждый закодирован своим собственным геномом в молекуле ДНК.
Хотя белки построены из аминокислот 20 видов, в состав ДНК входит всего четыре основания. Итак, с одной стороны во фрагменте ДНК у нас закодирован ген, который состоит из последовательности различных комбинаций А, Г, Т и Ц, а с другой – последовательность из аминокислот 20 видов, образующих соответствующий белок. Гамов пытался выяснить, как именно расположение оснований ДНК определяет, или кодирует, каждую из этих 20 аминокислот. В 1954 г. он пригласил Уотсона, Крика и других известных ученых разного профиля (всего 20 человек – по одному на каждую аминокислоту), чтобы направить совместные умственные усилия на решение проблемы кодирования белков.
Для каждого члена этого маленького интеллектуального братства взломщиков кода Гамов приготовил шерстяной галстук с вышитой на нем нитью РНК. Он окрестил эту группу Клубом РНК-галстуков. «А почему не Клубом ДНК-галстуков?» – спросите вы. Дело в том, что Джим Уотсон убедил Гамова направить усилия по расшифровке кода именно на РНК, руководствуясь принципами строения клетки[13]. Хотя у высших организмов ДНК находится внутри ядра, белки образуются снаружи ядра, в области, называющейся цитоплазмой[14]. При таком пространственном разобщении требуется некий посредник, который должен переносить информацию от ДНК к месту синтеза белков. Некоторые прогрессивные ученые полагали, что таким посредником может служить РНК, которая во множестве содержится и в ядре, и в цитоплазме.
Уже в начале 1900-х гг. химики анализировали состав РНК и ДНК и поняли, что эти молекулы состоят из одного биохимического теста. Их полные названия – рибонуклеиновая кислота и дезоксирибонуклеиновая кислота – показывают, насколько они близки между собой. «Дезокси» означает, что в каждом структурном компоненте ДНК на один атом кислорода меньше, чем в РНК. Этот лишний атом кислорода делает РНК химически гораздо менее стабильной молекулой.
На протяжении многих десятилетий считалось, что ДНК и РНК – химические компоненты, не выполняющие никаких функций[15]. Ученые уделяли им мало внимания. Гораздо интереснее были белки, играющие роль ферментов или сигнальных веществ, как, например, инсулин. ДНК вышла на первый план в биологии только после того, как Освальд Эвери с коллегами из Рокфеллеровского университета показал, что это молекула, отвечающая за наследственные изменения у бактерий[16], а Уотсон и Крик в 1953-м описали структуру ДНК в виде двойной спирали[17]. Поскольку еще в 1947 г. исследователи выдвигали теорию, что РНК копирует ДНК[18], возникло предположение, что РНК должна также играть важную роль в химических процессах у живых организмов.
Обычно РНК состоит только из одной цепочки, а ДНК – двойная спираль, тем не менее обе молекулы говорят на одном языке. Как и ДНК, последовательность РНК записана с использованием алфавита из четырех букв. Первые три – А, Г и Ц – такие же, как и в ДНК. Четвертая буква – У (урацил) – занимает в алфавите РНК такое же место, что и Т в алфавите ДНК. Таким образом, когда РНК копирует участок ДНК, она несет ту же информацию.
Гамов всегда любил масштабные обобщающие теории, поэтому начал работать над решением проблемы кодирования, не имея ничего, кроме карандаша, бумаги и собственного мозга. В 1953 г., тогда же, когда открыли двойную спираль, он предположил, что три основания могут кодировать одну аминокислоту[19]. Он опирался на математические расчеты. Если взять четыре вида букв алфавита ДНК или РНК и попробовать составить все возможные двухбуквенные комбинации, то у вас получится только 16 вариантов. Это слишком мало, чтобы записать все 20 видов аминокислот, которые образуют белок. Однако если попробовать из четырех букв алфавита ДНК или РНК собрать все возможные трехбуквенные комбинации, то получится 64 таких триплетных кодона. Этого более чем достаточно, чтобы закодировать 20 аминокислот. С такой задачей могут справиться и более длинные последовательности оснований, но вполне хватит трехбуквенных. Таков наиболее экономный формат генетического кода.
Однако какие именно три основания кодируют каждую аминокислоту? Хотя Гамов и привлек крупнейшие умы XX столетия к этой проблеме, члены галстучного клуба лишь глубоко в ней завязли. К концу 1950-х гг. Гамов оставил попытки взломать код, убедившись, что решение задачи не может быть найдено на «чисто теоретической основе»[20].
Гамову нужен был биологический аналог Розеттского камня. Только вместо текста, написанного одновременно египетскими иероглифами и греческим языком, там должна была изображаться последовательность аминокислот и кодирующая ее последовательность РНК. Но такого камня не существовало – ученым необходимо было его создать. И для этого надо было определить, существует ли на самом деле гипотетический посредник, может ли РНК быть недостающим звеном между нашими генами и структурными элементами живого – белками.
В 1950-х гг. множество ученых, в том числе Джим Уотсон и Фрэнсис Крик, искренне верили в теорию, утверждавшую, что РНК может переносить информацию из ядра клетки, от ДНК, к цитоплазме, где синтезируются белки. Но когда исследователи попытались найти эмпирические доказательства того, что РНК выступает посредником в живых системах, вначале их ожидали неудачи. Первое разочарование наступило, когда выяснилось, что в большей части молекул РНК в цитоплазме клетки основания А, Г, Ц и У встречаются в одинаковых пропорциях, независимо от того, какие белки синтезирует клетка. В этом было не больше смысла, чем если бы обнаружилось, что в Девятой симфонии Бетховена и в "Bad Romance" Леди Гаги разные ноты встречаются в одних и тех же пропорциях. Можно ожидать, что у этих совершенно разных музыкальных произведений будет соответственно разное соотношение фа-диезов, си-бемолей и других нот. Аналогично предполагалось, что у матричных РНК (мРНК), кодирующих разные белки, состоящие из разных последовательностей аминокислот, должно быть разное соотношение А, Г, Ц и У.
Второе разочарование было связано с тем, что большинство молекул РНК в цитоплазме очень стабильны: появившись, они довольно долго сохраняются. Однако исследователи наблюдали случаи, когда клетка быстро, всего за несколько минут, переключалась с одного набора белков на совершенно другой. Например, если поменять источник пищи для бактерий, они остановят производство пищеварительных ферментов для прежней еды и немедленно начнут генерировать белки, подходящие для новой. Точно так же если бактерию заразит вирус (а есть вирусы, поражающие именно бактерии, они называются бактериофагами или просто фагами), то бактерия переключится с производства бактериальных белков на белки фага. Следовательно, настоящая мРНК должна быть нестабильной, чтобы можно было быстро начать выработку другого белка. Крайне стабильная природа большинства клеточных РНК, казалось, не позволяла им быть тем посредником, который искали исследователи.
Среди ученых, все еще убежденных в том, что мРНК существует, но ускользает от наблюдения, были сотрудники Института Пастера в Париже Франсуа Жакоб и Жак Моно. Ранее они уже сделали важнейшие открытия, обосновав, как именно у бактерий включаются и выключаются гены, и теперь обратили свое внимание на РНК. В 1960 г. во время визита в Кембридж Жакоб встретился со своими друзьями Фрэнсисом Криком и Сиднеем Бреннером, возглавлявшим лабораторию в Королевском колледже[21]. Жакоб рассказал о своих последних экспериментах с регуляцией генов у бактерий, а затем разговор перешел к захватывающим догадкам о роли мРНК как связующего звена между геном и белком.
Внезапно и почти одновременно Крик и Бреннер подскочили. Они вспомнили недавние эксперименты Кена Волкина и Ларри Астрахана – исследователей из Окриджской национальной лаборатории в штате Теннесси. Изучая бактерию кишечную палочку (Escherichia coli), зараженную фагом Т2, Волкин и Астрахан обнаружили быстрое образование новых молекул РНК, которые были меньше, чем содержащиеся в клетке стабильные РНК[22] (сейчас мы знаем, что стабильные РНК – это составная часть рибосом, фабрик по производству белков). По целому ряду причин Волкин и Астрахан интерпретировали свои данные так, что РНК превращается в ДНК. Но что, если в действительности они заметили ту самую неуловимую мРНК?
Такая возможность воодушевляла, но гипотезу мРНК нужно было подтвердить экспериментально. Сидней Бреннер и Франсуа Жакоб планировали через несколько недель навестить генетика Мэтью Мезельсона в Калифорнийском технологическом институте. Было решено, что они втроем проведут необходимые тесты. Мезельсон вместе со своим коллегой Фрэнком Сталем незадолго до того применил новую методику с использованием чрезвычайно быстро вращающейся центрифуги – они проверяли предположение Уотсона и Крика, что во время репликации ДНК нити двойной спирали расходятся. Их результаты подтвердили гипотезу, согласно которой каждая дочерняя двойная спираль состоит из одной «старой» родительской нити и одной новосинтезированной.
Теперь Бреннер, Жакоб и Мезельсон хотели использовать такую же ультрацентрифугу в попытке найти иголку мРНК в стоге рибосомных РНК. Они намеревались заразить кишечную палочку фагом, который заставит бактерию начать вырабатывать другие белки. Одновременно с фагом ученые добавили бы радиоактивный урацил (помеченный углеродом–14), который встроился бы только в новообразованные молекулы мРНК фага, но не в существующие бактериальные РНК. Если гипотеза верна, то мРНК фага должна была появиться как раз в этот момент. Такой результат позволил бы найти пропущенное звено между ДНК и белком.
И действительно, Бреннер, Жакоб и Мезельсон с помощью ультрацентрифуги обнаружили радиоактивную мРНК фага, которая была явно меньше, чем РНК в рибосомах. Как и предсказывалось, эти молекулы РНК были короткоживущими, они соединялись с существующими бактериальными рибосомами для синтеза белков новых видов, необходимых вирусу для его черного дела[23]. Какой бы неуловимой ни была мРНК, ее наконец удалось поймать.
Чтобы понять этот биологический процесс, представьте себе проигрыватель пластинок. Рибосома – сам проигрыватель, мРНК – виниловая пластинка, а белок – музыка, которую вы слышите, когда опускаете иглу. В зависимости от вашего настроения вы можете менять пластинки, но оборудование остается неизменным. Точно так же как проигрыватель заставляет звучать любую пластинку, рибосома может работать с любой попавшейся мРНК. Именно от мРНК зависит, какой конкретный белок производится, будь то белки фага, кишечной палочки или какие-либо другие; пластинка определяет, какую музыку вы слышите.
Ученым было так сложно найти мРНК, потому что только 5% от всего множества РНК, содержащихся в клетке бактерии, – те, что представляют матричную РНК. Остальные 95% – это рибосомные РНК. Более того, у кишечной палочки около 4000 генов, каждый из которых дает мРНК разного размера и с разной последовательностью оснований. То есть мРНК конкретной разновидности в клетке гораздо меньше 5%. И, наконец, большинство молекул мРНК живут всего несколько минут, поэтому их очень трудно ухватить. Рибосомные РНК, напротив, не только широко распространены в цитоплазме, но и живут довольно длительное время, так что легко понять, почему ученым, стоявшим у истоков данного направления науки, потребовалось столь много времени, чтобы разобраться во всей этой истории с разными РНК.
Сравнение с проигрывателем помогает объяснить, как рибосомы и мРНК работают совместно, чтобы в итоге образовать белок. Но когда требуется понять, как РНК кодирует белок, нам стоит выключить музыку и открыть книгу.
Страницы большинства книг заполнены письменной речью – буквами, словами, предложениями. В алфавите книги жизни, записанной на языке ДНК, не 26 букв, как в английском языке, и не 22 буквы, как в иврите, а всего 4 буквы: А, Г, Ц и Т. Значение каждого слова и каждого предложения определяется последовательностью этих четырех букв – тем, в каком порядке они расположены.
Итак, сколько потребуется книг, чтобы передать суть жизни, то есть описать всю ДНК в определенном организме? Конечно, ответ зависит от размера генома – общего количества ДНК в клетке организма. Геном человека насчитывает около 3 млрд букв, или оснований, упакованных в 23 хромосомы[24].
Предположим, что страница, написанная обычным шрифтом, содержит примерно 3000 знаков; значит, для записи генома человека потребуется миллион страниц. Большая книга может содержать до 500 страниц, тогда для последовательности всего генома необходимо 2000 книг – это многовато для домашней библиотеки, но лишь малая часть хранилища городской библиотеки. Каждая хромосома состоит из одной молекулы ДНК и соответствует примерно 90 книгам. Геном бактерий, например кишечной палочки, намного меньше. У бактерий весь геном расположен на одной кольцевой хромосоме. Он содержит 4,5 млн оснований и вполне мог бы разместиться в трех библиотечных книгах.
Как мы уже выяснили, для создания белка нам нужен посредник в виде РНК, чтобы перенести информацию от ДНК к рибосоме. РНК, которые образуются естественным путем, не копируют постранично огромную книгу ДНК. У них есть определенные точки начала и окончания, которые, скорее всего, не совпадают с разрывами страниц. В общем, мы можем представить мРНК не как фотокопию целой страницы бумажной книги, а как выделенный участок текста из электронной книги, скопированный в несколько кликов в отдельный электронный документ. Мы просто выделяем движением курсора определенный фрагмент текста и затем вставляем его в пустой документ в нашем текстовом редакторе. А с помощью простой функции «найти/заменить» мы можем одновременно заменить все Т в ДНК на У в РНК, смоделировав таким образом естественный химический процесс.
Эта процедура копирования и вставки, когда фрагмент ДНК копируется в виде молекулы РНК, постоянно происходит в нашем теле, ведь она запускается всякий раз при необходимости синтезировать новые белки. мРНК копирует разные области ДНК в зависимости от того, что требуется в конкретное время и в конкретном месте. У детей копируются иные участки генома, чем у взрослых. В сердце копируются одни участки генома, а в мозге, печени и коже – другие. То есть процесс копирования строго регулируется.
После того как процедура копирования и вставки завершена, мы можем рассмотреть последовательность нашей мРНК. Это набор из А, Г, Ц и У, например такой:
Допустим, что мы знаем, как расшифровываются группы из трех оснований – триплетные кодоны. Вот наш словарь. Вместо аминокислот для каждого кодона я выбрал трехбуквенные слова:
АУГ = тот
ЦЦУ = наш
УЦГ и УЦЦ = кот
ААА и АГА = ест
АУА = суп
УУУ = или
УГУ и УАУ = уху
ЦГЦ = вол
ЦУЦ = жук
ЦУУ = как
ГГА = сын
ГУА и ГУУ = шли
ГАА и ГАГ = лес
ААУ = зал
АУУ = мал
УУГ = пес
УУА и УАА = оба
ГЦГ и ГЦЦ = яма
УГГ = там
АГУ и АГЦ = хор
Мой словарь чрезвычайно ограничен, в нем всего 20 слов по аналогии с 20 аминокислотами. Некоторые из этих слов закодированы единственным кодоном («жук» закодирован ЦУЦ). Другие слова (кот, ест, уху и т. д.) закодированы более чем одним кодоном, точно так же как и в генетическом коде. Вы можете спросить, почему в природе сформировалась система, где используется так много кодонов (64), чтобы зашифровать всего 20 слов (аминокислот). Неужели код нельзя организовать более изящным способом?
Эта кажущаяся неказистость – одна из тех вещей, которые всегда ставят физиков вроде Гамова в тупик. Если вы знаете уравнения Максвелла, вы можете решить проблему классической физики. Но в биологии действует только одно правило: «Главное, чтобы работало». Как только система, какой бы заумной она ни казалась, начинает хорошо функционировать, она закрепляется в процессе эволюции и ее практически невозможно изменить. И неважно, что хороший инженер мог бы сделать это устройство проще и эффективнее.
Теперь, когда мы знаем, как перевести сообщение из последовательности кодонов в содержательный текст, нам надо понять, где начинать чтение и где его заканчивать. Следует ли начать с левого конца, прочтя ГУА как «шли», и продолжить чтение до правого конца строки? Это может показаться разумным, но у природы есть другой способ. Триплет АУГ используется для обозначения начала предложения. Соответствующее правило для нашего словаря означает, что предложение должно начинаться со слова «ура», которое закодировано как АУГ. То есть мы просто просматриваем последовательность слева направо в поисках первого АУГ, а затем оттуда начинаем читать с помощью словаря.
Все идет хорошо, пока мы не наткнулись на кодон УАГ, которого нет в нашем словаре. Ах да, нам нужен еще один триплет, чтобы обозначать конец предложения – точку[25]. Так и сделаем.
УАГ = конец предложения = точка
Теперь наша расшифровка завершена:
Когда мы определили старт– и стоп-кодоны (АУГ и УАГ), разделять кодоны пробелами уже нет необходимости. Если у нас есть последовательность мРНК в виде непрерывной строки букв и мы знаем, что надо читать по три буквы за раз, то мы все равно получим нужную информацию.
Хотя Гамов предложил триплетную природу кода, на протяжении 1950-х гг. это оставалось лишь хорошей догадкой. А в 1961 г. Фрэнсис Крик со своими коллегами провел остроумный эксперимент с мутациями в гене фага, вызванными акридиновыми красителями, и окончательно доказал наличие триплетов[26]. Акридиновые красители – плоские молекулы, похожие на основания ДНК. Они встраиваются в двойную спираль, и при удвоении молекулы ДНК их ошибочно принимают за основания, что приводит к вставке неправильных оснований в дочернюю цепь. Представьте себе книги, расположенные в ряд на книжной полке. Если вы втиснете туда еще одну книгу, то все другие должны сдвинуться на одну позицию, чтобы вставленная книга поместилась. А если вы добавите две книги, то остальные сдвинутся на толщину этих томов.
С помощью нашей лингвистической аналогии можно продемонстрировать, как такие вставки могут повлиять на сообщение и как множественные вставки подтверждают идею триплетного кода. Начнем с нашего гипотетического сообщения. Я выделил старт– и стоп-кодоны курсивом:
А вот что происходит, если из-за акридинового красителя в случайное место будет вставлена У (выделено подчеркиванием):
Наше предложение начинается правильно, но вставка У сдвигает рамку считывания. Мы называем это «мутацией со сдвигом рамки». В геноме человека такие мутации происходят довольно часто и могут приводить к неприятным результатам, например к муковисцидозу, болезни Крона и болезни Тея – Сакса. Сдвиг рамки так опасен потому, что после вставки получается бессмысленный набор слов. Более того, кодон УАГ, который раньше обозначал конец предложения, теперь не прочитывается, поэтому бессмысленное предложение все продолжается и продолжается. Если бы эта мРНК кодировала белок, то он был бы бесполезным.
Давайте теперь посмотрим, что произойдет, если мы добавим две молекулы акридинового красителя, приведя к вставке двух оснований. Это так же разрушительно, как и вставка одного основания:
В данном случае сдвиг рамки считывания привел к появлению стоп-кодона УАГ в правом конце строки, но полученное предложение все равно бессмысленно. Если бы это была мРНК, то измененный белок опять же оказался бы бесполезен.
И, наконец, давайте обратимся к последствиям вставки трех оснований:
Если код триплетен, как показано, то в предложении появляется лишнее слово «или», но остальные слова на месте. В целом предложение более или менее можно понять.
Именно это показал Крик с коллегами, подтвердив, таким образом, исходную гипотезу Гамова. Вставка одного основания была фатальна. Двух – тоже фатальна. Но вставка трех более или менее сохраняла функциональность! То есть кодоны должны были быть образованы группами из трех оснований.
Гамов и его Клуб РНК-галстуков предположили, что генетический код трехбуквенный, а РНК, вероятно, выступает связующим звеном между ДНК и белками. Бреннер, Жакоб и их коллеги подтвердили второе предположение – убедительно идентифицировали мРНК, которая переносит информацию из нашей ДНК в клеточные фабрики по производству белков – рибосомы. Но мы все еще не могли прочитать эту информацию. К началу 1960-х гг. генетический код так и не был расшифрован – пока за дело не взялся молодой ученый Маршалл Ниренберг.
В 1959 г. Ниренберг получил должность независимого исследователя в Национальном институте артрита и метаболических заболеваний[27] в Бетезде (штат Мэриленд). Прежде чем заняться биохимией и защитить в этой области диссертацию, Ниренберг выполнил магистерскую работу во Флоридском университете на ручейниках – насекомых, чьи личинки живут в воде, а взрослые особи напоминают мотыльков. Возможно, Ниренберг не хотел признавать, что начал свою научную карьеру, работая с букашками, так как впоследствии он опустил этот факт в своей нобелевской лекции. Ниренберг смело предпринял попытку взломать генетический код. Он мало общался с ведущими авторитетами в этой области и никогда не получал шерстяной РНК-галстук. В отличие от Гамова, полагавшегося только на перо и бумагу, Ниренберг решил подступиться к проблеме кода как экспериментатор, с помощью биохимии. Для этого требовалось воссоздать в пробирке процесс синтеза белка, когда белок получается на основе мРНК.
Ниренберг опирался на революционное достижение коллег-биохимиков из Массачусетской больницы общего профиля (MGH) в Бостоне – Элизабет Келлер и Пола Замечника, которые разработали метод синтеза белков вне клетки с помощью компонентов, выделенных из печени крысы[28]. Замечник и другие авторы впоследствии показали, как то же самое можно делать и с экстрактом клеток кишечной палочки. Эту разработку и применил Ниренберг. Если описывать кратко, его подход заключался в том, что клетки бактерии разрушались, чтобы получить неочищенные рибосомы, а затем к ним добавляли разные последовательности РНК в качестве матрицы для синтеза белка[29]. Пройдя несколько раз по ложному следу, Ниренберг и его сотрудник Генрих Маттеи наконец столкнулись с тем, что простая молекула РНК, состоящая только из У, так называемая поли(У), определяет синтез белка, в состав которого входит лишь аминокислота фенилаланин. Прелесть молекулы поли(У) была в том, что, откуда бы рибосома ни начинала считывать информацию, получался один-единственный вариант триплета – УУУ, который неизменно кодировал фенилаланин. Так впервые был разгадан один из элементов генетического кода: УУУ кодирует фенилаланин[30].
После этого стал понятен дальнейший путь: скармливать рибосомам различные последовательности РНК и смотреть, какие белки получаются. Выяснилось, что поли(Ц) и поли(А) кодируют соответственно полипролин и полилизин. Таблица расшифрованных значений кодонов росла: три были найдены, оставалось определить еще 61. Безусловно, первые три кодона были простыми, потому что все буквы в каждом кодоне были одинаковыми. Для более сложных вариантов кодонов требовался другой подход.
И тут на сцене появился Гобинд Корана[31]. Он родился в бедной индуистской семье в Райпуре, который сейчас часть Пакистана, а тогда относился к Индии. Корана учился в Англии и Швейцарии. Впервые он получил известность благодаря работам в области изучения генетического кода, когда был профессором в Висконсинском университете в Мадисоне. Корана со своей группой изобрел метод химического синтеза ДНК, при котором нуклеотиды присоединялись к процессу по одному. Затем он использовал недавно открытый фермент, который синтезировал копию РНК с ДНК[32]. Красота этого метода заключалась в том, что он позволял очень точно задать последовательность ДНК и, соответственно, скопированной с нее молекулы РНК. Эти РНК помещали в систему синтеза белка в искусственных условиях, где они работали как матрицы для синтеза соответствующей последовательности аминокислот[33]. Корана получал все возможные комбинации трех оснований, скармливал их системе синтеза белка в искусственных условиях и анализировал, какие цепочки аминокислот образуются в результате. Таким образом, он помог заполнить таблицу генетического кода, за что в 1968 г. разделил Нобелевскую премию по физиологии и медицине с Маршаллом Ниренбергом[34].
Когда Гамов прочитал об этих открытиях в новостях, он обрадовался, что проблема кода наконец решена, хотя и не мог удержаться от выпада в адрес экспериментального подхода. «Это решение выглядит значительно менее элегантным, чем простая теоретическая корреляция, которую я изначально мысленно представлял, – сказал он. – Но у него есть неоспоримое преимущество – оно верное»[35].
Расшифровка кода, используемого мРНК для записи структуры белков, была огромным достижением, но без ответа оставался еще один большой вопрос. Наличие кода важно, но что потом? Должен совершаться процесс, который «прочитывает» всё, что закодировано. Как же мРНК обеспечивает расстановку аминокислот в нужной последовательности, чтобы они соединились и получился белок?
Фрэнсис Крик в 1955 г. пришел к ответу на этот вопрос путем умозаключений, и его предположение стало беспрецедентным триумфом теоретического подхода в биологии. Он вообразил не описанный ранее класс молекул, руководствуясь исключительно убеждением, что они должны представлять собой недостающее звено в большой системе генетического кода[36]. Так Крик предсказал существование группы «адаптерных молекул», у которых по два конца. Одним концом каждая молекула соединена с какой-либо из 20 аминокислот. Другой конец должен распознавать соответствующий триплетный кодон на мРНК и связываться с ним[37].
Эти адаптеры, соединяющие аминокислоты и мРНК, можно сравнить с переходниками, с помощью которых разные электронные устройства подключаются к розеткам. Чтобы зарядить наушники, вам нужен правильный переходник для нужной вилки, форма которой зависит от того, находитесь вы в США, Великобритании или Германии. С аминокислотами то же самое, что и с наушниками. У вас есть розетка (триплетный кодон) и подходящая к ней трехштырьковая вилка – антикодон. Поскольку кодон и антикодон комплементарны друг другу, они соединяются за счет связей между парами оснований. И, подобно удлинителю, вмещающему несколько розеток, молекулы-адаптеры выстраиваются в ряд, соединяя кодоны мРНК с соответствующими аминокислотами, так что получаются растущие цепочки, которые в итоге обеспечивают образование белков. По крайней мере, такова была гипотеза Крика.
Фрэнсис Крик предположил, что каждый триплетный кодон на мРНК (снизу) должен быть распознан некой «адаптерной молекулой», несущей соответствующую аминокислоту, например лизин или валин, показанные на рисунке. Это можно сравнить с зарядными кабелями для телефонов и наушников, которые выступают в качестве переходников, соединяя трехштырьковую розетку и электронное устройство
Однако чистая теория может завести нас слишком далеко. Кто-то должен был отправиться в лабораторию и проверить, можно ли найти такие молекулы-адаптеры. Этим кем-то стал Пол Замечник, разработавший метод синтеза белка, благодаря которому Ниренберг и открыл первый кодон. Замечник предварительно пометил аминокислоты радиоактивным изотопом углерода, чтобы можно было их отследить, – примерно так действуют банки, когда прячут в мешки с деньгами взрывающуюся капсулу с краской, чтобы выявить купюры, если их украдут. Когда Замечник добавил эти радиоактивные аминокислоты в свою систему синтеза белка в искусственных условиях, случилось нечто удивительное. РНК малого размера стали радиоактивны. Это означало, что аминокислоты присоединились к РНК. Никто прежде такого не наблюдал, но это именно то, что должно было бы произойти, если бы существовали РНК, выполняющие функцию адаптеров между кодонами и аминокислотами[38]. Позднее эти малые молекулы получили название транспортные РНК (тРНК), потому что они переправляют нужную аминокислоту к белковой цепи, растущей внутри рибосомы. И, как мы увидим еще неоднократно, тРНК хоть и мелкие, но могущественные молекулы.
К середине 1960-х гг. некоторым ученым казалось, что история РНК закончена. Каждая мРНК управляет синтезом «своего» белка с помощью генетического кода, который на тот момент был уже взломан. Кроме того, в синтезе белка участвовали стабильные РНК двух видов: транспортные РНК, которые соединяли каждый кодон мРНК с соответствующей аминокислотой, и рибосомные РНК, которые, о чем мы еще поговорим подробнее, строили белок.
Даже сегодня многие люди рассматривают РНК примерно так же. Они видят в ней служанку при ДНК, обеспечивающую бесперебойную работу клеточных механизмов, которые превращают наследственную информацию в живую материю. Безусловно, этот биологический процесс необходим для выживания каждого организма на Земле. И если бы на сказанном история РНК действительно заканчивалась, это все равно было бы колоссальным достижением нашей маленькой молекулы. Однако, как оказалось, передача сообщений всего лишь одна из суперспособностей РНК.
Глава 2
Сплеснение жизни
Трудно представить более идиллическое место для научного симпозиума, чем лаборатория Колд-Спринг-Харбор. Она расположена на острове Лонг-Айленд и больше похожа на летний лагерь, чем на исследовательский центр: среди холмов, которые весной украшаются цветущими магнолиями, азалиями и кизилом, стоят дощатые домики, а на ветру покачиваются парусные лодки. Лаборатория была основана в 1890 г. и всегда имела репутацию серьезного, хоть и несколько сонного научного учреждения. Именно здесь начиная с 1940-х гг. генетик Барбара Мак-Клинток в уединении проводила свои кропотливые эксперименты, отслеживая вариации окраски кукурузных зерен, чтобы определить, как функционируют в клетках гены и хромосомы. Ее открытие «прыгающих генов» в итоге было удостоено Нобелевской премии.
Сонливость быстро слетела с лаборатории Колд-Спринг-Харбор, когда в 1968 г. ее директором стал Джим Уотсон. Он был столь проницательным, амбициозным и напористым, что быстро превратил лабораторию в мощный центр, который выдавал одно крупное научное открытие за другим. В тот период лаборатория стала знаменита проводившимися там конференциями, на которых молекулярные биологи делились своими недавними находками. Она была и остается местом, где можно сразу узнать о новейших достижениях, без многомесячного ожидания публикации, и наладить новое сотрудничество.
В июне 1977 г. темой симпозиума в Колд-Спринг-Харбор стала структура и функции хромосом у высших организмов. В то время я был научным сотрудником в Массачусетском технологическом институте, работал именно в данной области и очень обрадовался возможности посетить симпозиум. До сих пор помню сильнейшее восхищение, когда две группы исследователей, одной из которых руководил мой сосед по МТИ Фил Шарп, а другой – Рич Робертс из Колд-Спринг-Харбор, вышли выступать и рассказали о решении загадки, над которой ученые бились более десяти лет.
Что же это была за великая тайна? После того как на примере кишечной палочки и ее фагов была выявлена связь между ДНК, мРНК и белком, многие ученые переключились на исследование более сложных организмов, таких как растения, животные и особенно человек. Имелись все основания ожидать, что фундаментальные принципы хранения и передачи биологической информации будут неизменны у всех форм жизни. Как однажды сказал нобелевский лауреат Жак Моно, «то, что верно для кишечной палочки, должно быть верно и для слона»[39]. Но когда биохимики изучили человеческие клетки, выращенные в чашках Петри в термостате, они пришли в замешательство. Предполагалось, что мРНК сначала обнаружится в клеточном ядре, где находился ее хромосомный прародитель – ДНК. И в самом деле, РНК нашлась в ядре, но она казалась слишком большой, чтобы быть готовой мРНК, – в среднем в 10 раз больше[40], чем требуется для кодирования белка. Это казалось странным, ведь мРНК, которая поступала из ядра в цитоплазму, была как раз нужного размера, чтобы кодировать белок.
Действительно ли эта огромная РНК, найденная в ядре клетки, должна была превратиться в мРНК? Если да, то что делали все эти лишние нуклеотиды в ядерной РНК, коль скоро они не кодировали белок? В тот день в Колд-Спринг-Харбор ответ был обнародован, и он стал первым сигналом к пониманию того, что РНК способна на большее, чем просто передавать информацию от ДНК.
Я работал через дорогу от лаборатории Фила Шарпа в МТИ, но это еще не означало, что я мог непосредственно наблюдать открытие Фила. Иногда я пересекал Эймс-стрит и заходил в его лабораторию в Онкологическом центре, чтобы посоветоваться насчет проблем с экспериментами. Там работала моя приятельница Клэр Мур, и они с Филом всегда охотно обсуждали мои исследования, но дружно отмалчивались по поводу своих собственных.
Это было довольно странно. Ученые, как правило, не могут удержаться, чтобы не рассказать о своей работе, о потрясающем открытии, которое может случиться в ближайшем будущем. Однако Фил, Клэр и постдокторант Сью Берже знали, что нашли что-то особенное, и не хотели поднимать шум. И только год спустя, сидя в аудитории Колд-Спринг-Харбор, я узнал, как Фил и Рич Робертс решили загадку[41] про неподходящий размер человеческой мРНК.
Ключ к разгадке был получен благодаря аденовирусу – ДНК-вирусу, вызывающему у людей обычную простуду. Подобно тому как бактериофаги помогли первым молекулярным биологам понять принципы работы генов у бактерий, человеческие вирусы подсказали подход к изучению молекулярных особенностей биологии человека. В конце концов, и фаги, и человеческие вирусы обманом заставляют клетки своих хозяев обеспечить инфекционный цикл вируса за счет ресурсов клетки, поэтому паразиты должны использовать те же фундаментальные биологические механизмы, что используют их хозяева. Изучение вирусов имеет и практические преимущества: зараженные клетки содержат множество копий вирусной ДНК и соответствующую полученную РНК; таким образом, исследователи получают много материала для работы.
Обе группы, из МТИ и Колд-Спринг-Харбор, сначала составили карты расположения разных генов в хромосоме аденовируса. Они не ожидали, что это приведет к какому-то крупному открытию, картирование требовалось, просто чтобы получить необходимую информацию для дальнейшей работы – предстояло выяснять, как экспрессируются вирусные гены. Сравнивая вирусную ДНК с ее мРНК-копией из цитоплазмы клетки, исследователи ожидали, что ДНК и мРНК будут соответствовать друг другу в пределах всей последовательности. Разумеется, у бактерий было бы именно так.
Однако обнаружилось, что длинные внутренние участки мРНК, которые должны были бы присутствовать, если бы мРНК была непосредственной копией ДНК, просто исчезли. Оказалось, что мРНК собиралась из кусочков, некоторые фрагменты из середины были вырезаны, а концевые участки последовательности соединены друг с другом. Исследователям пришлось признать, что кодирующие области генов аденовируса не были непрерывными, а состояли из фрагментов, разделенных участками некодирующей ДНК, которые мы теперь называем интронами.
Слушатели этого доклада в Колд-Спринг-Харбор были ошеломлены. Сам Джим Уотсон, присутствовавший в тот день в аудитории, называл это открытие «бомбой». Считалось, что матричная РНК – непрерывная копия своего гена. Это казалось единственным эффективным вариантом, и сложно было понять, почему белок-кодирующие участки ДНК могут быть разделены интронами и как эти интроны могут вырезаться. Являлись ли все эти сложные операции, в ходе которых фрагменты генетической информации попадали в ДНК, но исключались из мРНК, просто бессмысленной акробатикой, неким эволюционным танцем, никуда не приводящим? Или в процессе такого вырезания и соединения выполнялись какие-то важные задачи? Какое-то время мир молекулярной биологии сосредоточился на этом вопросе, изо всех сил пытаясь найти ответ.
Большинство белок-кодирующих генов у человека и многих других эукариотов прерываются участками некодирующей ДНК, называемыми интронами. Каждый интрон (на схеме он светло-серый) транскрибируется как часть РНК-предшественника (в середине), который потом подвергается сплайсингу до функциональной мРНК (внизу)
Вскоре выяснилось, что все обстоит еще сложнее. Ученые начали понимать, что интроны встречаются не только у вирусов, а характерны и для эукариотов – организмов, хранящих свою ДНК в ядре. Как только было объявлено о существовании интронов у аденовирусов, многие ученые в лабораториях по всему миру поняли, что в генах, которые они изучают, тоже вставлены интроны. Например, уже в 1977 г. биологи из Гарварда Ширли Тилгман[42] и Фил Ледер обнаружили, что кодирующая последовательность человеческого гена белка крови гемоглобина разделена двумя интронами. И интроны, и кодирующие участки копировались с гена, так что в ядре клетки образовывалась длинная молекула РНК, но затем, прежде чем мРНК попадала в рибосомы для образования белка, мать-природа доставала секатор[43]
