Наука и техника
15:45, 7 апреля 2006

Мы считаем Рядовые пользователи будут соревноваться с суперкомпьютерами и дальше

В конце марта организаторы поиска "инопланетных радиосигналов" - интернет-проекта SETI@Home - обратились к его участникам с просьбой помочь материально. Проекту, столкнувшемуся с финансовыми проблемами, предсказывали скорую смерть и вытеснение из круга пользовательских интересов более понятными сервисами, в создании которых тот может поучаствовать сам - скажем, блогами или вики-энциклопедиями. Как оказалось, похороны идеи "распределенных вычислений" были все-таки преждевременными: 4 апреля стало известно, что уже собраны 200 тысяч из необходимых 750.

Может показаться, что для научных расчетов достаточно суперкомпьютеров. Но дело в том, что суперкомпьютеры могут не все. В первую очередь, они не могут сами решать, что именно рассчитывать, и за них решают или военные, или ученые, занятые той или иной серьезной и глобальной проблемой. Те же задачи, которые не попадают в этот разряд, чаще всего претендовать на многотерафлопсовые вычислительные мощности не могут. Идея заменить многотерафлопсовый кластер компьютерами рядовых интернет-пользователей возникла в 1997 году - его считают первым в истории распределенных вычислений. Девять лет подряд желающие могут поучаствовать в поисках простых чисел, разговорчивых инопланетян или лекарства от СПИДа.

SETI@Home появился в Интернете в мае 1999 года. За шесть лет до этого Конгресс США приостановил финансирование "не-сетевого SETI", научного проекта с 33-летней историей. С 1960 года астрономы занимались расшифровкой сигналов, собранных радиотелескопами, в поисках возможных "сообщений" на фоне "радиошума", создаваемого различными космическими телами. Разумеется, "установить контакт" не было главной целью, но казалось самым привлекательным побочным эффектом - причем привлекательным не только для ученых. Так или иначе, интернет-версия астрономических расчетов сумела заинтересовать довольно широкую аудиторию. Которая, что самое главное, была - в отличие от NASA - готова предоставить свои компьютеры для вычислений, показавшихся слишком непрактичными конгрессменам.

Замысел был прост: чтобы помочь ученым, вовсе не обязательно разбираться в тонкостях астрофизики и владеть вычислительным центром. Программе-клиенту, куда поступает порция данных с радиотелескопа Аресибо, достаточно обычного домашнего или офисного компьютера. Где - в ее отсутствие - самым популярным процессом было "бездействие системы". По первому требованию астрономическая программа уступает место другим. А "бесполезное" время становится полезным - если, конечно, считать таковым поиск разумной жизни в космосе. Пока, согласно статистике, такие взгляды разделяет примерно 5 миллионов 600 тысяч добровольных вычислителей.

В прошлом году стало известно, что проект - в его прежней форме - сворачивается. Как выяснилось позже, речь шла о смене "программной платформы" - отказаться решили от прежних механизмов, оставив неизменными цели. Программисты из университета Беркли переписали "движок", сделав его универсальным: ядро системы под названием BOINC вошло в пакеты для предсказания климата, борьбы со СПИДом и даже проектирования Большого Адронного Коллайдера.

SETI@Home остается наиболее популярной, но уже не единственной возможностью приобщиться к "звездным" подсчетам. Так, в 2005 году, когда сразу нескольким эйнштейновским открытиям исполнилось сто лет, стартовал проект Einstein@Home, посвященный проверке теории относительности. Речь, как объясняют организаторы, идет о поиске гравитационных волн, однако пока Интернету доверили только вступительную стадию. 100 тысяч компьютеров собирают данные с двух телескопов-интерферометров - германского GEO-600 и американского LIGO. Интерферометры, в свою очередь, сканируют Вселенную в поисках событий, которые могли бы стать причиной "волнообразных" искривлений пространства - по мнению астрофизиков, на эту роль вполне подходит коллапс пары черных дыр или взрыв на поверхности пульсаров. "Неучтенные" пульсары - то, что интернет-сообществу предстоит найти.

Менее громких, но более "осязаемых" результатов ждали от проекта Stardust@Home. В январе 2006 года на Землю вернулась капсула зонда Stardust, слетавшего к комете Вильда-2 за "звездной пылью" - крайне разреженным веществом, рассеянным в межпланетном пространстве. Пыли, которую специальная "губка" зонда собрала вблизи кометы, было достаточно для того, чтобы с ней ученые разобрались сами. Куда интереснее (и сложнее) дела обстояли с материалом, осевшим на обратной стороной губки по пути. Согласно расчетам, там должно было накопиться около 50 частиц, залетевших из других звездных систем. И, если химический анализ таких количеств вещества - трудная, но доступная приборам задача, то поиск мнимой иголки в стоге мнимого сена - утомительная работа. Которую астрономы решили перепоручить другим: добровольцам предстояло "выслеживать" треки космических частиц на нескольких миллионах микрофотографий накопителя-аэрогеля.

Строго говоря, Stardust@Home (в отличие от всего остального) распределенными вычислениями назвать нельзя: астрономам прежде всего нужны были зрение и внимание участников, и только потом их процессоры. В этом случае суперкомпьютеры были бы точно бессильны: ученые отмечали, что без помощи публики им самим пришлось бы посвятить разглядыванию снимков примерно двадцать лет. Пока, впрочем, все впереди: как сообщили организаторы в конце марта, начало поисков откладывается "из-за соображений безопасности", которые мешают им начать сканировать космическую губку.

Когда астрономы познакомились с перспективами распределенных сетей, те все еще считались занятием для узкого круга математиков. Математики делились компьютерным временем с программами, ищущими простые числа или взламывающими шифры - и в этом добились самых показательных успехов. Так, например, проект Enigma родился из желания прочитать три германских шифровки, оставшиеся "невскрытыми" со времен Второй мировой войны - и две из них к настоящему времени уже прочитаны. То же касается подбора RSA-ключей способом "прямой атаки": добровольцы продемонстрировали, что современные криптометоды также не выдерживают многомесячных "бури и натиска". Правда, понять это можно было и без практической проверки.

Успехи SETI@Home остаются скорее социальными и инженерными, чем научными: мало кому прежде удавалось собрать "суперкомпьютер из воздуха" для решения почти невозможной задачи. Этого примера, однако, хватило, чтобы за отвлеченными мечтателями последовали прагматики: распределенными средствами теперь ищут лекарства и изучают свертывание белков, так или иначе связанных с вполне реальными болезнями. Еще одна сеть - ClimatePrediction.net - при поддержке телерадиокомпании BBC строит модели климата будущего. Новомодным способом "посчитать все" увлеклись, пусть и ненадолго, даже биологи, не склонные обращаться за ответами к суперкомпьютерам: проект Lifemapper должен был выявить закономерности в распределении видов по планете, но расчеты приостановили. Список можно, конечно, продолжить.

Самым "гуманитарным" из приложений называют поисковую систему Majestic-12: бывший российский программист Алекс Чудновский создал на основе распределенной сети систему, которая проиндексировала около миллиарда страниц. Подобная система (которая, разумеется, пока не конкурирует с Google или Yahoo) может, по словам ее автора, рано или поздно отменить "монополию на поиск", нравящуюся далеко не всем.

Любопытно, что подобные сети некоторые эксперты считают если не альтернативой, то противовесом популярным концепциям Web 2.0 и "мультимедийного интернета". Сторонникам последних приписывают такую точку зрения: многоцелевой компьютер, пригодный не только для легального веб-серфинга - "угроза не только авторскому праву, но и будущему вообще". И в самом деле, в распределенных сетях можно при желании разглядеть, например, проверенную платформу для взлома криптосистем. Убедительной иллюстрацией к этому стало в 2001 году "дело системного администратора Маковена", участие которого в проекте Distributed.net приравняли к компьютерному мошенничеству. Маковен, в числе прочих, занимался криптоанализом шифра с закрытым ключом RSA64.

Многих смущает близость механизмов распределенных вычислительных сетей и "пиратского" p2p - ведь можно предположить, что при ужесточении "копирайтного" законодательства кто-нибудь начнет пересылать зашифрованные mp3-файлы или просто конфиденциальную информацию под видом результатов расчетов. Маковена обвинили, в частности, в том, что он, устанавливая программу-клиент на компьютеры пользователей, создавал возможность кражи данных из госучреждения - каковым являлся колледж, где он работал. А координаторов SETI не так давно упрекали в том, что они подвергают опасности компьютеры, позволяя им обрабатывать возможные сигналы инопланетян.

Впрочем, организаторы "гражданских суперкомпьютеров" опасаются подделки или порчи данных на Земле. Хотя это рано или поздно происходит с любым открытым проектом, "испорченную" статью в Википедии можно заметить и исправить, а пропущенные число или радиосигнал способны обессмыслить все остальные расчеты. Именно поэтому мощность распределенной сети в несколько раз ниже той, какой могла бы быть - часть ресурсов уходит на перепроверку и дублирование результатов.

Так или иначе, распределенные вычисления - лишний повод вспомнить, что скрывается за аббревиатурой ЭВМ, вытесненной более расплывчатыми терминами.

Борислав Козловский

< Назад в рубрику