В четверг, 5 августа в Nature - одном из самых авторитетных научных журналов - появилась очень необычная статья. Ее авторы (которых более 57 тысяч) представили доказательства того, что геймеры могут быть намного более эффективны в выполнении сложной научной работы, чем самые мощные суперкомпьютеры. Играя в созданную авторами статьи компьютерную игру, пользователи подбирали пространственные структуры белков – то есть выполняли ту задачу, надежного решения которой в современной биологии нет.
Белки – это важнейшие биологические молекулы, которые выполняют в организме огромное множество функций. Из белков построены кости, зубы, внутренние органы, мышцы, белки участвуют в синтезе ДНК и катализируют биохимические процессы. Знание структуры и функций различных белков помогает ученым не только понимать фундаментальные принципы организации живого, но также разрабатывать новые лекарства и искать методы лечения заболеваний.
Любой белок представляет собой линейный полимер, построенный из аминокислот. В естественных условиях – то есть внутри живых систем - каждый белок имеет строго определенную пространственную организацию. Если почему-либо конфигурация белка нарушается, то он начинает намного хуже выполнять свои “обязанности” или вовсе становится нефункциональным.
Однозначно предсказать, как именно тот или иной белок будет сворачиваться в клетке, чрезвычайно сложно, даже если аминокислотный состав этого белка известен. Считается, что нативная конфигурация белковой молекулы всегда обладает наименьшей свободной энергией по сравнению со всеми прочими вариантами, однако подобрать такую конфигурацию очень сложно, так как все части белка имеют много степеней свободы. Иными словами, существует огромное количество возможных вариантов того, как именно различные регионы полимерной молекулы могут располагаться рядом друг с другом.
Кроме того, чрезвычайно сложно просчитать взаимодействия между отдельными атомами белковой молекулы, которые оказываются на том или ином расстоянии друг от друга. Можно подобрать оптимальную пространственную структуру одного региона белка, но если “торчащие” из образовавшегося домена атомы будут слишком сильно отталкиваться от соседей, такая конфигурация окажется невыгодной в целом и никогда не будет реализована в природе.
Исследователи научились определять, как именно уложены белковые молекулы в живых системах при помощи различных дорогостоящих и трудоемких методов, самым популярным из которых является рентгеновская кристаллография. Из исследуемого белка выращивают кристалл и облучают его рентгеновскими лучами. Анализируя картину рассеяния лучей, специалисты могут очень точно воспроизвести структуру белка.
Рентгеновская кристаллография – отличный метод, однако он может использоваться далеко не для всех белков. Выращивание белкового кристалла – это очень непростая процедура, для которой не существует единого прописанного алгоритма и, кроме того, некоторые белки упорно не желают кристаллизоваться, несмотря на все усилия ученых.
Так что умение предсказывать структуру белков по их аминокислотной последовательности по-прежнему остается одной из самых актуальных задач для биологов. К настоящему моменту было разработано довольно много компьютерных программ, которые перебирают возможные варианты сворачивания белка, определяя, какой из них наиболее вероятен. Все они требуют очень серьезных вычислительных мощностей – для того чтобы рассчитать структуру белка, необходимо использовать суперкомпьютер. Время работы таких агрегатов стоит очень дорого, и, к тому же, его все равно не хватит для расчета структуры всех тех важных белков, конфигурацию которых исследователям очень хочется узнать.
В качестве альтернативы суперкомпьютерам были разработаны программы, использующие распределенные вычисления. Люди, желающие помочь ученым в определении структур белков, скачивают специальное ПО, которое занимается подбором конфигураций в то время, пока компьютер добровольца не занят основной работой.
Одной из самых популярных программ распределенных вычислений для расчета белковых структур стала Rosetta@home, созданная специалистами из университета штата Вашингтон под руководством Дэвида Бейкера (David Baker). С 2005 года, когда была запущена Rosetta@home, ее скачали более 81 тысячи добровольцев. И довольно скоро Бейкер и его коллеги начали получать письма, в которых обладатели программы жаловались, что им больно смотреть, как плохо она работает (пользователи могли наблюдать за процессом перебора вариантов).
Rosetta@home и ее аналоги довольно эффективно вычисляют оптимальную конфигурацию белка в целом, но на последних этапах они начинают "буксовать". Программа мучительно перебирает сотни вариантов, как согнуть оставшийся неприкаянным кусочек белка, в то время как наблюдатель отчетливо видит, что его нужно повернуть вправо градусов на 10 и обернуть вокруг вон того выступающего домена.
Авторы Rosetta@home решили воспользоваться способностями людей видеть наиболее подходящие варианты и употребить их на благо науки. В 2008 году они выпустили компьютерную игру Foldit (от английского fold it – сверни это), в которой пользователям предлагалось самостоятельно гнуть и поворачивать белковую молекулу, добиваясь получения структуры с минимальной энергией (ее просчитывает компьютер). Неоптимальные конфигурации показываются красным цветом, и по мере снижения свободной энергии их окраска меняется на менее тревожную. За получение структур с минимальной энергией пользователи получают баллы, причем геймеры могут сравнивать свои результаты с результатами других людей.
За два года Foldit скачали более 100 тысяч человек. Геймеры рассказывали журналистам Nature News, что они проводят за подбором белковых структур немалую часть своего свободного времени. Причины, по которым люди тратят часы на перемещения и повороты белковых структур, могут быть самыми разными, но, судя по количеству подсевших игроков, игра сумела зацепить в них что-то очень важное.
Геймер с ником Susanne, занимающая первое место по количеству набранных баллов, рассказывает, что ей очень нравится видеть результат своих действий – изначально бесформенный белок постепенно становится симметричным и красивым. “Игра дает мне возможности, которых я лишена в обычной жизни”, - подытоживает Susanne, работающая администратором в реабилитационном центре. Занимающий второе место в мире по количеству набранных баллов геймер CharlieFortsConscience рассказывает, что для него игра в Foldit – это возможность прикоснуться к миру большой науки, почувствовать свою значимость от участия в настоящих исследованиях.
Но какими бы не были мотивы игроков, конечный результат их страсти к игре оказался весьма эффективным. Бейкер и коллеги предложили геймерам подобрать структуры для десяти белков, а потом рассчитали наиболее возможные конформации этих белков при помощи Rosetta@home. Пять из десяти белков геймеры “щелкнули” лучше, чем программа, для трех белков результат оказался одинаковым и только для двух молекул Rosetta@home подобрала структуру лучше (хотя исследователи полагают, что эти две структуры все равно неверны по сути). В данном случае ученые сравнивали полученные конформации с теоретическими предсказаниями – рентгеноструктурный анализ этих белков должен быть проведен в ближайшее время.
Авторы вывели несколько составляющих, которые определяют, почему геймеры могут так хорошо подбирать структуры белков. В отличие от машины, человек все время держит в голове общую структуру белка и не станет рассматривать потенциально выгодные конформации, которые не впишутся в общую картину. Кроме того, геймеры намного лучше Rosetta@home справлялись с задачей, когда для подбора требовалось “раскрутить” уже частично сформированный домен. Компьютер отказывался от столь радикального шага, а человек понимал, что эти действия не нарушают общую структуру, и после подбора он вновь вернет разрушенные связи на место.
Люди в принципе использовали больше возможных стратегий поиска, чем машина – например, часть игроков предпочитала сначала работать с упрощенными моделями и добавлять детали по мере продвижения, а часть, наоборот, сосредотачивалась в основном на боковых доменах и доводила их до совершенства.
Еще один фактор успеха, недоступный машине – социальная активность геймеров. По желанию игроки могут подбирать структуры самостоятельно или в команде. В последнем случае за удачную конфигурацию очки начисляются всем членам команды. Вознаграждение стимулирует людей советоваться друг с другом, обсуждать наиболее удачные ходы и одновременно пытаться выведать, какую стратегию избрали соперники.
Авторы Foldit собираются проанализировать стратегии лучших игроков, чтобы попытаться использовать их для создания более эффективных компьютерных программ. Кроме того, ученые планируют разработать аналогичные игры для создания новых белков, которые могли бы выполнять те или иные медицинские задачи. Впрочем, создатели игры не отрицают, что у нее пока есть недостатки: например, для того чтобы приступить к подбору, игрокам нужна затравочная структура, рассчитанная при помощи компьютерных программ. Начинать сворачивать белок с нуля геймеры не могут – первые этапы, когда неопределенность еще очень велика, требуют от игроков специальных знаний. В будущем ученые намерены подобрать оптимальный баланс, чтобы максимально эффективно сочетать компьютерный анализ и анализ, выполненный людьми.
Foldit – не единственный проект, создатели которого эксплуатируют страсть людей к играм в научных целях. Например, в 2006 году стартовал проект Stardust@Home, участники которого ищут космическую пыль на выложенных в Сеть фотографиях различных участков неба. Проект оказался очень успешным, и в 2007 году был запущен Galaxy Zoo - проект, дающий возможность всем желающим классифицировать различные объекты, сфотографированные телескопами. Участники Moon Zoo ищут на Луне пропущенные учеными кратеры.
И хотя во всех этих проектах есть игровые моменты, только Foldit стал полноценной успешной компьютерной игрой, которая цепляет тысячи людей, заставляя их проводить все свое свободное время в виртуальном мире. Будет очень интересно пронаблюдать, как будет развиваться тенденция, опробованная на поиске структуры белков.