Экономика
09:31, 28 ноября 2023

«ИИ — суперсила любого бизнеса» Вице-президент Сбера Денис Филиппов о том, что даст мультимодальная нейросеть GigaChat

Елена Замирская
Фото: Сбер

Событием уходящего года стало появление мультимодальной нейросети GigaChat от Сбера. В апреле 2023 года альтернатива ChatGPT была презентована рынку, а за полгода достигла паритета с иностранным аналогом. В рамках международной конференции по искусственному интеллекту AI Journey была анонсирована обновленная версия GigaChat, в основе которой лежит модель для русского языка с 29 миллиардами параметров. О том, как генеративный искусственный интеллект помогает решать прикладные задачи в бизнесе и как трансформируются тренды в области ИИ и нейросетей, в интервью «Ленте.ру» рассказал вице-президент по цифровым поверхностям «Салют» Сбербанка Денис Филиппов.

«Лента.ру»: Денис, как вы оцениваете перспективы применения искусственного интеллекта для решения прикладных задач бизнеса? В какой точке относительно этих перспектив мы находимся сейчас?

Денис Филиппов: Искусственный интеллект в бизнесе применяется давно. В Сбере еще с 2018 года идет масштабная ИИ-трансформация, и ИИ-технологии уже более пяти лет используются в большом количестве продуктов. Те процессы, которые раньше требовали больших временных ресурсов, например, решения по кредитам, сегодня автоматизированы за счет использования ИИ, алгоритмов машинного обучения. Или же речевые технологии, которые автоматизируют контакт-центры, это тоже пример применения искусственного интеллекта в бизнесе, и они дают конкретный счетный финансовый эффект.

Так, в Сбере только за прошлый год это 250 миллиардов рублей. Совсем другая история — генеративный искусственный интеллект, большие языковые модели. В прошлом году мир увидел ChatGPT, который использует глубокое обучение для генерации текста и ответов на вопросы. Мы находимся на стадии, когда искусственный интеллект нового поколения только развивается. Работа в этом направлении — во многом исследовательская задача, но, очевидно, что уже сейчас открываются большие перспективы применения данных технологий в бизнесе.

В чем они выражаются?

Сегодня любая сфера бизнеса, где работают люди, нуждается в технологиях ИИ. Искусственный интеллект нового поколения может радикально повысить процент автоматизации различных операций и повысить производительность и эффективность конкретного человека. Мы не прогнозируем, что он заменит человека полностью, чего многие опасаются.

Речь скорее идет о том, что появится новый мощный инструмент в руках человека, который позволяет работать гораздо более эффективно. Простой пример — анализ различных документов. Я в силу своей профессии получаю огромное количество отчетов в формате ПДФ, мне надо изучить 300 страниц и сделать это быстро. Какая бы скорость чтения у меня ни была, все равно на эту задачу уйдет несколько часов, особенно если нужно вникать в детали. С помощью генеративного искусственного интеллекта можно сделать это гораздо быстрее. Для этого достаточно дать задачу символизации, выделить ключевые мысли в документе, задать ИИ вопросы по тексту, получить на них ответы.

Буквально за 5-10 минут можно составить общее представление о содержании 300 страниц текста. Очевидно, что это радикальное изменение парадигмы того, как мы потребляем информацию. Другой пример — работа редакторов, журналистов. Есть проблема чистого листа. По запросу генеративный искусственный интеллект может накидать идей структуры интервью, статьи, презентации. Дальше это можно дорабатывать, но в любом случае с помощью ИИ работа выполняется гораздо быстрее.

В программе AIJ-2023 ваш доклад озаглавлен «GigaChat. Суперсила вашего бизнеса». Планируете ли вы представить принципиальные усовершенствования или новые возможности сервиса?

В рамках AIJ-2023 мы презентовали нашу новую обновленную версию сервиса GigaChat, в основе которой лежит одна из наиболее продвинутых моделей для русского языка с 29 млрд параметров. Более того, мы достигли паритета в качестве с GPT 3.5 Turbo. Это большой результат. Поясню, как это работает. Модели на входе дается текст, и он может быть разного размера. В нашей новой версии сервиса объем текста увеличен до шести страниц A4. Дальше уже модель будет с этой информацией работать.

Мы планируем эти возможности постоянно расширять. Кроме того, модель стала более умной и решает много задач уже на другом уровне качества. Команда сравнила ответы новой и предыдущей моделей и зафиксировала общее повышение качества на 23 процента. С фактологией анонсированная модель справляется на 25 процентов лучше предыдущей версии. Мы проверяем модель не только по технологическим метрикам.

Помимо бенчмарка Massive multitask language understanding (MMLU), который позволяет в принципе понять способности модели решать разные задачи, мы решили тестировать GigaChat по тому же принципу, как тестируют людей на знания. Для такой оценки хорошо подходят тесты, используемые в системе образования, включая ЕГЭ. Обновленная версия GigaChat сдала единый государственный экзамен по обществознанию на 67 баллов. Для сравнения – в 2023 году в среднем по стране выпускники школ набирали 56,4 балла по этому предмету, а минимальный балл для подачи в вуз составлял 45 баллов.

Какую пользу GigaChat приносит российскому бизнесу уже сейчас? В каких отраслях вы видите наибольший потенциал от использования моделей уровня GigaChat для решения бизнес-задач?

Технологии искусственного интеллекта — действительно суперсила для бизнеса. В первую очередь мы развиваем партнерства с компаниями, которые занимаются автоматизацией работы людей, работы с электронной почтой, работы с документами. К нам часто приходят с кейсом, когда та или иная компания накапливает большое количество информации внутри себя, и ее сотрудникам, выполняя ту или иную задачу, нужно опираться на базу знаний.

Сейчас это решается простым поиском по документам, а с помощью GigaChat можно делать интерактивный диалоговый поиск. То есть человек, столкнувшись с каким-то вопросом, задачей в своей работе, может спросить GigaChat, как ему действовать, и GigaChat, опираясь на базу данных, выдаст ему необходимые рекомендации. Это снимает нагрузку в виде необходимости изучать разнородные источники информации, читать много текста, чтобы найти ответ на свой вопрос.

В ноябре этого года Open AI приостановил прием платных подписок GPT+ во имя экономии вычислительных мощностей. В то время как в одном из последних интервью Илон Маск упомянул, что хAI планируют удваивать свои вычислительные мощности каждые пару месяцев. Как вы видите развитие соревнования с лидерами гонки в обучении больших языковых моделей в условиях, когда столько компаний конкурирует за вычислительные ресурсы?

Чтобы создавать такие модели, очевидно, нужно обладать большими мощностями. Без этого не обойтись, потому что мы ориентируемся в первую очередь на то, как работает наш мозг. А он высокопроизводителен, в нем огромное количество нейронных связей. Чтобы обучать модели, которые еще даже не приблизились по своему объему и количеству параметров к нашему мозгу, нужны гигантские вычислительные мощности. Кроме того, эти модели обучаются на огромном количестве данных.

В нашем случае это 7,5 петабайта. Чтобы было понятнее — в объеме это примерно, как пятьдесят Ленинских библиотек. Чтобы модель прошла все эти данные и освоила их, нужны большие вычислительные мощности. При этом тенденция такова, что уже сейчас, с имеющимися вводными, модель эффективна с точки зрения бизнеса.

У обновленной версии сервиса GigaChat, в основе которой лежит модель с 29 миллиардов параметров, хорошие способности для решения различных бизнес-задач. Конечно, мы не говорим о том, что модель достигла уровня человека, но для многих бизнес-задач это и не требуется. Мы, конечно, считаем, что вычислительные мощности критичны, их надо наращивать. Но это нужно для обучения. А бизнесу нужен готовый продукт, модель, которой можно пользоваться, и в этом прелесть ситуации для бизнеса уже сегодня.

< Назад в рубрику