«Нейросетевые технологии уверенно вступили в фазу зрелости» Сергей Марков — о трендах в развитии технологий ИИ

Фото: Shutterstock / Fotodom

Искусственный интеллект все больше проникает в повседневную жизнь современного человека, открывая перед ним большие возможности. О том, в каком направлении будут развиваться новые технологии, как они будут регулироваться и конкурировать на мировом рынке, в интервью «Ленте.ру» рассказал Сергей Марков, управляющий директор — начальник управления экспериментальных систем машинного обучения департамента общих сервисов «Салют» Сбербанка.

Сегодня остается все меньше людей, которые не слышали о сервисе ChatGPT. А недавно Сбер представил собственную версию генеративного сервиса — GigaChat. В разработке участвуют команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI и ряда отраслевых экспертов. Почему Сбер решил инвестировать в разработку собственного решения?

Сергей Марков: Сбер — не единственная технологическая компания, которая разрабатывает собственные технологии в этой области. Свой инструмент для инструктивной генерации выпустила компания Google (чат-бот Bard), о таких амбициях заявили Amazon, Samsung, появились аналоги от различных AI-лабораторий (например, Claude от Anthropic AI) и множество open-source-решений. Все технологические лидеры понимают, что это не только потенциально огромный рынок, но и инструмент технологического лидерства. В свое время поиск в интернете или соцсети стали локомотивами развития отрасли на многие годы, так же и системы, подобные ChatGPT и GigaChat, способны не только изменить технологический ландшафт мира информационных технологий, но и полностью перекроить рынки в этой сфере. Неудивительно, что многие компании ввязались в технологическую гонку, ведь приз в ней может быть действительно огромным. И в случае поиска или соцсетей лидерами стали отнюдь не пионеры этих направлений.

Кроме того, российский рынок сегодня обладает собственной спецификой: OpenAI официально запретила применение своего решения в России, а передача данных при работе с ChatGPT за рубеж создает серьезные риски в области безопасности.

Фото: Shutterstock / Fotodom

Чем GigaChat отличается от своего западного аналога? Что он умеет?

В целом в GigaChat сделана ставка на мультимодальные взаимодействия с пользователем: он умеет не только писать тексты, но и рисовать изображения, а скоро освоит и другие виды информации. Кроме того, основной фокус сделан на более глубоком знании русского языка, а также финансовой области знаний, ведь от решения, разработанного банком, люди ждут больше четкой и ясной информации в этой области. Но в целом центральной темой развития GigaChat остается стремление стать лучшим сервисом по качеству предоставляемых ответов и по спектру решаемых задач.

Есть мнение, что для создания производительных нейросетей требуются огромные человеческие ресурсы и передовое «железо». Что под капотом у GigaChat? Как обучалась модель? Кто принимал участие в ее создании?

Под капотом у сервиса находится NeONKA (NEural Omnimodal Network with Knowledge-Awareness, нейронная омнимодальная сеть, основывающаяся на знаниях) — нейросетевой ансамбль, который включает в себя модели ruGPT-3.5, Kandinsky, ruCLIP и FRED-T5. Все эти нейросети были обучены при помощи суперкомпьютера Christofari Neo, а над его созданием трудились три команды разработчиков систем машинного обучения — SberDevices, Sber AI и Института искусственного интеллекта (AIRI).

Кроме того, для создания обучающих корпусов моделей было привлечено огромное число внутренних и внешних экспертов в самых разных областях. А работа по дополнению и совершенствованию обучающего набора данных продолжается и сейчас. Более того, вовлекается все больше экспертов.

GigaChat — один из самых крупных и амбициозных российских проектов в области машинного обучения за последние годы, а возможно, самый крупный и самый амбициозный.

Фото: Сбер

Нейросети и технологии искусственного интеллекта довольно быстро проникают во многие области нашей жизни. Мы уже знаем примеры, когда с их помощью создают изображения, пишут курсовые работы, сочиняют стихи. Какие еще сферы применения GigaChat вы видите?

Это, безусловно, работа со звуком, музыкой и видео, подготовка графиков и презентаций, написание программного кода, использование в самых разных учебных и производственных областях и просто для развлечения. Сейчас трудно предугадать все области применения подобных технологий, ведь развитие генеративных моделей является постепенным продвижением к созданию систем общего (или универсального) искусственного интеллекта, способных решать неопределенно широкий спектр интеллектуальных задач. Отдельно стоит упомянуть про возможности для бизнеса выводить на новый уровень свои сервисы и процессы с использованием GigaChat. Здесь открываются возможности автоматизировать бизнес-процессы, где задействована работа с большими объемами текстов, можно создавать суфлеров-«подсказчиков» для тех, кто общается с клиентами. Всю мощь нейросетевой модели можно использовать для составления типовой документации, отчетности, инструкций. Можно прогнозировать снижение порога входа для создания собственных виртуальных ассистентов — с GigaChat значительно упрощается этот процесс.

Расскажите о том, как правильно составлять запросы в сервисе, есть ли какой-то алгоритм, как получить максимум от возможностей GigaChat?

GigaChat ориентирован в первую очередь на задачи творческого характера: написание текстов (рекламных, информационно-развлекательных, художественных и так далее), проведение мозгового штурма по разным направлениям, создание изображений. Он умеет кое-что и в области программного кода, может давать советы на разные темы. Например, можете попросить его объяснить работу блокчейна или дать вам пошаговый процесс для изучения китайского языка. При этом с фактологической точностью у GigaChat, как и у многих аналогичных систем, дела пока далеки от идеала, но мы работаем в этом направлении: будущие версии системы будут способны работать с базами знаний, интернетом и внутренней памятью.

С сегодняшнего дня GigaChat доступен владельцам наших умных колонок SberBoom и SberBoom Mini с ассистентом Салют. Для запуска диалога достаточно произнести: «Салют, включи GigaChat», — и можно начинать создавать запросы. Например, пользователь может сгенерировать текст по заданным параметрам, озвучив запрос ассистенту, и получить голосовой ответ. Можно также попросить сочинить сказку, поздравление, предложить варианты подарка, обсудить идею, придумать новый рецепт, шутку или название, составить пошаговую инструкцию или план тренировок.

В последние пару месяцев развернулся активный дискурс на тему регулирования в области обучения и применения таких нейросетевых моделей. Считаете ли вы необходимым внедрение систем регулирования искусственного интеллекта?

Использование любых достаточно могущественных технологий сопряжено с определенными рисками. Можно привести несколько примеров. Например, технологии эпохи пара были сопряжены с рисками взрыва котлов, возгорания топлива; технологии «электрического века» — с рисками поражения электрическим током; применение автотранспорта связано с рисками автоаварий, и так далее. У человечества богатый опыт управления технологическими рисками, и многие лучшие практики в этой области могут быть успешно использованы для управления ИИ-рисками. Вот лишь некоторые классические методы, применимые в этой области: разработка детальной таксономии рисков, их количественная оценка, стандартизация, контроль качества, сертификация, профилактика и надзор, создание технических средств безопасности и другие. Некоторые из этих методов применяются уже сегодня, а другие ждут внедрения. Первые шаги в области регулирования отрасли делаются сейчас во всем мире. При этом важно учитывать, что чрезмерная зарегулированность, как это часто бывает, может легко сделать из технологических лидеров технологических аутсайдеров.

Фото: Shutterstock / Fotodom

Мировая гонка в сфере искусственного интеллекта задает новые вызовы для технологичных компаний. Какие тренды сегодня на рынке и какое нейросетевое будущее вы ждете?

О трендах в области искусственного интеллекта можно говорить долго, поэтому остановлюсь лишь на некоторых из них.

Важное направление сегодня — создание мультимодальных моделей генеративных нейросетей. Часто говорят о так называемых M3-моделях, то есть моделях, объединяющих в себе мультимодальность (способность работать с разными модальностями информации: визуальной, звуковой и так далее), многозадачность и многоязычность. Четвертой «M» может стать multi-embodiment (дословно — «мультивоплощение»), возможность применения модели для управления самыми разными агентами в виртуальном или физическом мире, а пятой — мультиэкспертность (возможность нейросети при решении поставленной задачи взаимодействовать со специализированными подсетями, другими моделями, инструментами и сервисами).

Также существует тренд в сторону увеличения размера моделей и роста уровня их «интеллекта». С 2017 года объемы вычислений, затрачиваемых на обучение самых продвинутых фундаментальных моделей, растут темпами, напоминающими экспоненциальные. В связи с этим важное значение имеет такое свойство больших трансформерных нейросетей, как эмерджентность, то есть скачкообразный рост качества решения тех или иных интеллектуальных задач при достижении моделью определенного количества параметров.

Подводя итоги последнего десятилетия в области машинного обучения, можно сделать вывод, что за это время нейросетевые технологии уверенно вступили в фазу зрелости. Многие задачи, о решении которых машинами еще пару десятков лет назад можно было только мечтать, сдались под напором новых методов, многократно выросших вычислительных мощностей и объемов цифровых данных. Этот прогресс вплотную приблизил мечту о создании систем общего искусственного интеллекта к ее постановке в прикладной плоскости. Возможно, именно в эти дни в главных исследовательских центрах мира принимаются решения, которые существенно повлияют на будущее нашего общества, и разрабатываются технологии, благодаря которым наша жизнь во многих аспектах никогда уже не будет прежней. Системы искусственного интеллекта все более тесно входят в нашу повседневную жизнь, сплетаясь в единую систему с интеллектом естественным, усиливая его возможности и открывая дорогу для новых, ранее невиданных сфер прогресса.

Лента добра деактивирована.
Добро пожаловать в реальный мир.
Бонусы за ваши реакции на Lenta.ru
Как это работает?
Читайте
Погружайтесь в увлекательные статьи, новости и материалы на Lenta.ru
Оценивайте
Выражайте свои эмоции к материалам с помощью реакций
Получайте бонусы
Накапливайте их и обменивайте на скидки до 99%
Узнать больше