Ученые Научно-исследовательского центра по развитию суперкомпьютерных технологий (NCSA) представили новый способ предсказания трехмерной структуры белков с помощью искусственного интеллекта (ИИ) и суперкомпьютеров. Результаты исследования опубликованы в журнале Proceedings of the National Academy of Sciences (PNAS).
Узнайте больше в полной версии ➞Белки выполняют широкий спектр биологических функций, которые зависят от их трехмерных структур, возникающих при сворачивании аминокислотных цепочек. Проблема фолдинга (сворачивания) белков была признана биологами как одна из величайших проблем современной науки, поскольку до сих пор было тяжело предсказать, в какую структуру свернется определенная аминокислотная последовательность.
Обычными методами изучения структуры белка являются рентгеновская кристаллография, которая позволяет определить атомную и молекулярную структуру кристалла, и криоэлектронная микроскопия, включающая мгновенное замораживание молекул в жидком азоте и бомбардировку их электронами для получения изображений. Однако алгоритмы AlphaFold на основе ИИ позволяют точно и быстро предсказать структуру по аминокислотным последовательностям.
Новая вычислительная структура APACE упрощает использование инструмента AlphaFold2 и повышает его скорость. Модель также предсказывает конформационное разнообразие белков, что является важным, поскольку белки могут изменять свою форму при выполнении своих функций.
APACE затрагивает управление данными, что достигается за счет размещения модели и базы данных AlphaFold2 размером 2,6 терабайта на суперкомпьютере, откуда нейронные сети могут легко получать доступ к данным. Другие улучшения включают оптимизацию центральных и графических процессоров для распараллеливания шагов предсказания структуры белка, требующих интенсивного использования GPU.
Для тестирования APACE команда использовала 300 графических процессоров NVIDIA A100 суперкомпьютера Delta в NCSA. Они обнаружили, что APACE на два порядка быстрее стандартных реализаций AlphaFold2, что значительно ускоряет предсказание структуры белков. Этот инструмент можно использовать вместе с роботизированными лабораториями для автоматизации и ускорения научных открытий. Работа также была успешно воспроизведена на суперкомпьютере Polaris в Argonne Leadership Computing Facility.