Люди в 70 процентах случаев лучше компьютера справляются с выравниванием нескольких небольших последовательностей ДНК. С таким результатом завершился эксперимент Phylo, проводимый канадскими и американскими исследователями с 2010 года. Результаты их работы опубликованы в журнале PLoS One.
Ученые создали специальную игровую оболочку, в которой от игрока требовалось выровнять несколько последовательностей ДНК таким образом, чтобы число совпадений между ними было максимальным. Для простоты ДНК была представлена цветными квадратами четырех цветов, которые соответствовали четырем нуклеотидам, из которых она состоит. Если игрок справлялся с задачей за отведенное время, его результат вносился в базу Phylo.
Далее авторы сравнивали полученные выравнивания с теми, которые способна делать одна из самых совершенных на данный момент программ для множественного выравнивания MULTIZ. Если результат игрока превосходил результат компьютерного алгоритма, то его имя вносилось в “зал славы” Phylo. Оказалось, что из 350 тысяч выравниваний, сделанных тремя тысячами игроков с начала эксперимента, 70 процентов оказалось точнее компьютерных.
На данный момент существуют алгоритмы гарантированно оптимального выравнивания не более двух последовательностей. Сложность такой задачи зависит от квадрата их длины n (сложность O (n2)). Если же требуется множественное выравнивание, то сложность возрастает пропорционально длине последовательностей n, возведенной в степень их числа k (сложность O (nk)) и оказывается в большинстве случаев недоступной для современных компьютеров при k>3. Поэтому программисты используют эвристические алгоритмы, дающие, как видно по успехам игроков, весьма приблизительный результат.
Алгоритмы выравнивания последовательностей ДНК и белков для современной биологии очень важны. Правильное выравнивание часто является основным источником информации о функционировании и родственных отношениях генов и организмов.
Эксперимент по своей концепции - привлечения широкой публики для решения актуальных научных задач напоминает проект FoldIt, в ходе которого волонтеры сворачивают белки в трехмерные структуры. В свою очередь, FoldIt был вдохновлен сетевым проектом по поиску внеземной жизни SETI.