Ученые выяснили, что основная часть генома человека - вовсе не мусор, как считалось раньше. Большой консорциум исследователей установил, что у 80 процентов ДНК есть какая-то биологическая функция. Это открытие достойно того, чтобы называться эпохальным, но правда ли ученые открыли именно то, о чем сообщается в пресс-релизах?
Не только гены
Проект, участники которого совершили столь громкое открытие, называется ENCODE (сокращение от Encyclopedia of DNA Elements, в переводе с английского - "энциклопедия фрагментов ДНК") и ставит перед собой по-настоящему всеобъемлющую цель - описать все последовательности генома человека, обладающие той или иной функцией. Задача очень важная: ДНК человека состоит из трех миллиардов "букв" (нуклеотидов), при этом собственно генов в ней всего 20 тысяч, и их общая длина слегка превышает 1 процент от всего размера генома. Зачем нужны остальные 99 процентов - долгое время было неясным.
Впрочем, один из возможных ответов на этот вопрос, крайне популярный у биологов конца прошлого века, отражен в названии, которым ученые в 1970-х окрестили весь непонятный массив генетических данных – "мусорная" ДНК (по-английски - junk DNA). Однако по мере дальнейшего изучения механизмов работы живой клетки становилось ясно, что гены - это далеко не единственное, что определяет, как будет реализована заложенная в ней наследственная информация.
Даже если в далеком будущем ученые выяснят, за что отвечает каждый из 20 тысяч генов Homo sapiens и бесчисленное множество их вариантов, то, глядя на распечатку генов конкретного человека, они все равно не смогут полностью описать, как он выглядит, насколько хорошо работают его сердце, легкие и другие органы, от каких болезней он страдает или сколько баллов наберет в тесте на IQ. Для того чтобы создать исчерпывающий портрет человека, помимо знания, какие именно у него есть гены, нужно как минимум понимать, какие регуляторные элементы управляют работой этих генов (кроме того, желательно учитывать, в каких условиях человек рос, но сегодня этот фактор считается куда менее значимым, чем раньше). Регуляторы "притягивают" специфические белки, которые могут запустить или выключить работу гена.
box#2093828
Но только знания последовательности генов и регуляторных элементов все равно недостаточно для создания полной картины работы генома. Еще один важный фактор - пространственное расположение в ядре фрагментов ДНК, на которых находятся гены и регуляторы. Очень может быть, что последовательность, запускающая работу гена, удалена от него на расстояние в десятки тысяч "букв" - но если нить ДНК изогнется в петлю так, что они соприкоснутся, ген будет активно функционировать.
Наконец, работа клетки зависит от того, как модифицирована ее ДНК. Ученые достаточно давно выяснили, что к "буквам" генетического кода могут быть "прикручены" различные химические довески, но истинная значимость таких изменений стала очевидной только в последние пару десятков лет. Часть модификаций (например, метилирование) "выключает" гены, другие "усовершенствования", наоборот, заставляют их работать без остановки. Помимо генов химическим изменениям могут подвергаться специфические белки под названием гистоны, вокруг которых обернута ядерная ДНК. Сложная укладка спиралей дезоксирибонуклеиновой кислоты позволяет "впихнуть" длиннющие нити в крошечное ядро - суммарная протяженность ДНК человека, например, составляет примерно два метра, а диаметр ядра при этом не превышает 20 микрометров (микрометр - миллионная часть метра).
Постепенно исследователи накапливали все больше данных о том, какие еще тонкости кроме собственно последовательности генов влияют на реализацию заложенной в организме информации. Организаторы проекта ENCODE поставили своей целью запротоколировать все эти "дополнения" к геному человека. Другими словами, они решили вычленить из массива "мусорной" ДНК все фрагменты, которые могут быть значимыми для работы клетки.
Не мусор
Проект стартовал в 2003 году, и в него было приглашено около 400 ученых со всего мира. Отдельные группы занимались разными "ветвями" исследования, а затем все их результаты объединялись, сравнивались и анализировались. Первый значимый рубеж был пройден в 2007 году, когда консорциум специалистов представил результаты анализа одного процента генома человека. Половина фрагментов была взята из хорошо изученных участков хромосом, а половина "представляла" геномную terra incognita. Предполагалось, что охарактеризованная учеными ДНК послужит своеобразным образцом, ориентируясь на который можно будет делать обобщающие выводы обо всем геноме.
Нынешний результат проекта ENCODE куда более существенен: на этот раз исследователи не ограничились одним процентом, а прошлись по всему человеческому геному. Всего ученые опубликовали 6 статей в одном из самых престижных научных журналов Nature, плюс еще два с половиной десятка материалов в журналах попроще. Специалисты искали все перечисленные выше потенциально значимые участки ДНК и, кроме того, оценивали, с какого процента "букв" синтезируется РНК. Этот процесс называется транскрипцией, и, собственно, именно он является прямым показателем того, что ген активен. Гены содержат информацию о белках в закодированном виде, но ферменты - строители белков расшифровывать этот код не умеют. Инструкции для них записываются на особую молекулу-посредник под названием матричная РНК (мРНК). Специальные белки считывают записанную в ДНК информацию и "переводят" ее на язык мРНК, понятный ферментам-строителям.
На заре изучения механизмов работы генома считалось, что транскрипция может идти только с генов. Один из открывателей структуры ДНК Френсис Крик даже постулировал это убеждение в своей знаменитой центральной догме молекулярной биологии, которая описывает процесс реализации генетической информации в клетке. Классический вариант центральной догмы гласит, что информация передается только по пути ДНК - РНК - белок, причем однонаправленно. Позже оказалось, что предложенная Криком схема на самом деле устроена несколько сложнее и потоки информации между тремя ее основными компонентами могут протекать более чем одним способом.
В частности, оказалось, что молекулы РНК образуются не только с генов, но и с участков той самой "мусорной" ДНК. Эти рибонуклеиновые кислоты представляют еще один тип регулировщиков работы генома и могут напрямую влиять на активность генов, определяя, как именно будет считываться записанная в них информация. Таким образом, участки ДНК вне генов, с которых идет такая транскрипция, уже нельзя причислить к "мусору". И по итогам нынешнего этапа ENCODE оказалось, что так или иначе РНК синтезируется с 60 процентами всей человеческой ДНК. Еще около 20 процентов генома подпадают под другие критерии потенциально значимых участков. И именно цифра 80 появилась во всех пресс-релизах и научно-популярных статьях, причем в большей части публикаций утверждалось, что вся эта ДНК, прежде считавшаяся ненужной, обладает некими биологическими функциями. И такую интерпретацию результатов можно назвать, как минимум, некорректной.
Легкое преувеличение
Все дело в том, что молекулярные машины, которые отвечают за внутреннюю кухню вокруг ДНК, несовершенны. Несмотря на удивительную точность и прецизионность своей работы - даже самая сложная человеческая техника пока далеко отстает от этого уровня - иногда эти машины ошибаются. Ферменты, копирующие ДНК, вставляют не ту "букву", белки, которые чинят поломки генома, вдруг пропускают целые куски или, наоборот, добавляют пару лишних фрагментов и так далее. Нередко такие ошибки оказываются для организма смертельными или же приводят к тяжелому недугу, но, с другой стороны, именно они формируют тот ресурс мутаций, без которых невозможны эволюционные изменения.
Многие из этих мутаций никак не сказываются на работе клетки, и эти безразличные для организма ошибки выпадают из "поля зрения" естественного отбора. Если лишняя копия гена не мешает работе остальных, то она может оставаться в геноме сколь угодно долго. Постепенно в ней будут накапливаться мутации, но если "буквы" в начале гена останутся неизменными, то ненужная копия будет продолжать транскрибироваться. Ферменты, синтезирующие РНК, узнают именно передние части генов (промоторы) и не умеют определять, "правильный" перед ними ген или "неправильный". Они начинают транскрипцию даже если ген обрывается на середине или от него вообще остался только коротенький "огрызок". В результате образуются короткие РНК, которые сразу же утилизируются специальными клеточными "мусорщиками". Недоделанные РНК не выполняют в клетке никакой полезной работы, однако по стандартам проекта ENCODE будет считаться, что участок ДНК, с которого идет подобная транскрипция, имеет какую-то функцию.
Так как ферменты могут ошибиться в любой момент, за миллионы лет в геноме появились не только лишние гены, но и лишние копии регуляторных участков, которые контролируют работу генов. И хотя такой регулятор давно не "привязан" ни к какому осмысленному фрагменту ДНК, его по-прежнему будут узнавать специальные белки, а значит, он попадет в список потенциально функциональных участков ENCODE.
box#2093830
Помимо генных фрагментов, порожденных ошибочной работой ферментов, в человеческих хромосомах очень много так называемых мобильных генетических элементов и остатков древних вирусов, которые умеют встраивать свои гены в ДНК клетки-хозяина. Мобильными генетическими элементами называют куски ДНК, способные перемещаться по геному. Они были открыты в конце 1940-х годов американской исследовательницей Барбарой Макклинток, однако у научного сообщества идея прыгающей ДНК получила признание только 30 лет спустя (а Нобелевскую премию за свои работы Макклинток получила и вовсе в 1983 году). И мобильные элементы, и когда-то встроившиеся в геном вирусы несут промоторы, так что с них тоже может идти транскрипция. Большинство чужеродных человеческому геному элементов давно перестали работать, но РНК с них зачастую синтезируются, и значит, эти фрагменты генома будут определяться проектом ENCODE как функциональные.
Таким образом, далеко не все участки ДНК из выделенных участниками ENCODE 80-ти процентов на самом деле выполняют в клетке хоть какую-нибудь функцию. Собственно, сами ученые и не утверждают, что все, найденное ими, действительно важно: биоинформатик Эван Бирни (Ewan Birney), координирующий процесс анализа полученных данных, в своем блоге признает, что сама по себе транскрипция, идущая с некоего участка ДНК, не является надежным показателем его функциональности. Главным признаком того, что данный фрагмент ДНК для чего-то используется, Бирни и его коллеги считают узнавание специфическими белками, которые запускают транскрипцию или выполняют функции регуляторов. Доля таких участков во всем геноме, по оценкам специалистов ENCODE, составляет около 20 процентов, причем сюда входят и участки ДНК внутри генов.
Однако и эту цифру рано называть окончательной - как уже говорилось выше, привлекать специфические белки могут остатки вирусной ДНК или фрагменты, оказавшиеся в геноме из-за "недосмотра" ферментов. Чтобы найти действительно важные для клетки последовательности, необходимо выяснить, какие из попавших в перечень ENCODE фрагментов ДНК сохраняются в геноме на протяжении длительного времени. Другими словами, ученым нужно отделить последовательности, находящиеся под давлением естественного отбора. Изменения в таких последовательностях приводят к гибели организма или делают его неспособным к размножению - и вот они, с большой долей вероятности, действительно выполняют в клетке какие-либо важные функции.
"Задача отделить действительно функциональные элементы от участков, которые транскрибируются случайно, потребует гораздо больше работы, чем уже было проделано", - считает ведущий исследователь Национального центра биотехнологической информации США Евгений Кунин. "Более того, это теоретически невозможно, чтобы 80 процентов последовательностей генома выполняло ту или иную биологическую функцию. Не может такая значительная часть генома быть предметом отбора", - пояснил Кунин "Ленте.ру".
Бирни признает, что окончательным маркером функционально важных участков ДНК должна быть их устойчивость при передаче из поколения в поколение. Однако ученый отмечает, что некоторые последовательности могут выпадать из этого правила - скажем, гены, отвечающие за форму носа, очень вероятно, не находятся под строгим давлением отбора. Но это не значит, что они не интересны исследователям, занимающимся генетикой человека.
Но если участники проекта ENCODE ориентируются на показатель в 20 процентов - почему во все пресс-релизы (в том числе, и пресс-релиз журнала Nature) попала в четыре раза большая цифра? Бирни объясняет эту странность так: "Сначала я настаивал на [использовании обеих цифр]. Но поместить в один абзац сразу два процентных показателя - значит, потребовать слишком много усилий от читателей. Им необходимо понять, почему между этими двумя цифрами такая большая разница, а соответствующие объяснения могут оказаться чуть более длинными, чем способны вытерпеть большинство людей". В итоге исследователи остановились на варианте 80 процентов, потому что в него включены данные всех экспериментов ENCODE. Кроме того, он лучше подчеркивает главную мысль проекта, а именно, что геном - это не массив "мертвой" ДНК, а структура, наполненная жизнью и активностью.
Ложка меда
Собственно, словосочетание "биологическая функция" тоже появилось только в пресс-релизах. В оригинальных статьях ученые используют куда более нейтральное определение "биохимическая функция", которое прямо не указывает на значимость этой "функции" для организма.
Небольшая подмена понятий, которую позволили себе участники ENCODE, отнюдь не умаляет достоинств проекта. Это колоссальное по своим масштабам исследование, которое дает ученым массу ценнейшей информации для работы. Некоторые практические результаты есть уже сегодня. Проанализировав мутации (так называемые однонуклеотидные полиморфизмы или снипы), которые повышают вероятность, что у человека разовьется тот или иной недуг, специалисты выяснили, что до трети таких изменений располагаются в регуляторных участках, причем многие из этих участков активны только в иммунных клетках. Подобные данные уже позволяют исследователям искать причины заболеваний прицельно в конкретном типе клеток, а не перебирать все возможные варианты.
"Такие масштабные геномные проекты - это всегда позитивно, - считает директор института биологии гена РАН Павел Георгиев. - Они позволяют очень сильно экономить средства. В таких проектах большое сообщество ученых целенаправленно решает одну конкретную задачу, и это всегда эффективнее по сравнению с ситуацией, когда какие-то отдельные лаборатории с довольно ограниченными возможностями самостоятельно пытаются что-то сделать".
У всех подобных проектов, за исключением разве что самых "очевидных", вроде "Генома человека", есть одна общая проблема: как донести до публики их ценность. Результаты работы исследователей зачастую очень специфичны, и для того, чтобы объяснить их суть, требуется много времени. Отсюда и берутся громкие заголовки и передергивания вроде 80-процентной функциональности генома. Намеренно вводить читателей в заблуждение, конечно, нехорошо, но, с другой стороны, иногда только такой прием позволяет привлечь внимание к по-настоящему важному проекту. Так что лукавых ученых, наверное, можно понять.