На конференции AI Journey («Путешествие в мир искусственного интеллекта») Сбер представил ИИ-помощника ГигаЧат на базе нейросетей GigaChat и Kandinsky. В интервью «Ленте.ру» директор дивизиона ИИ-помощника Сбербанка Антон Горшков рассказал, что такое ИИ-помощник, какие возможности теперь доступны пользователям и как эффективно применять их в рабочих и бытовых задачах.
«Лента.ру»: Что такое ИИ-помощник ГигаЧат от Сбера?
Антон Горшков: Мир цифровых сервисов постоянно усложняется.
У каждого приложения — свой интерфейс, свои правила и ограничения. Пользователи теряются в рутине и вынуждены постоянно переключаться между разными приложениями и сайтами, чтобы решать простые задачи. Они тратят время на повторение одних и тех же запросов, получают абстрактные советы, поэтому мы хотели сделать удобное и технологичное решение, которое будет освобождать человека, а не усложнять его жизнь. ИИ-помощник ГигаЧат, созданный на базе наших нейросетей, — это тот самый новый уровень сервиса, когда искусственный интеллект не просто отвечает пользователю, а совершает действия, выполняет задачи, помнит контекст и поддерживает естественный эмоциональный голосовой диалог.
Поговорим о современных пользователях генеративного искусственного интеллекта. Как выглядит их типичный день с ГигаЧатом?
Ежемесячно нашим сервисом пользуются 19 миллионов человек. Это жители крупных и небольших городов, школьники и студенты, люди разного пола, возраста и интересов. У каждого свой ритм жизни, а значит, и свой набор востребованных задач, ради которых они выбирают наш сервис.
Чтобы лучше понимать пользователей и соответствовать их ожиданиям, мы регулярно проводим исследования и используем любую возможность для прямого общения. Обратная связь помогает определить, в каких ситуациях ГигаЧат становится реальным помощником для каждого.
Какие задачи наиболее популярны у пользователей?
Наиболее популярное направление — работа с текстами. Это включает в себя их создание с нуля и редактирование, а также помощь в составлении официальных документов — от заявлений до договоров. На втором месте по популярности — подготовка к собеседованиям и деловым встречам. Здесь особенно востребована наша мультимодальность: пользователи могут общаться с моделью как голосом, так и в текстовом режиме, что позволяет эффективно отработать навыки коммуникации.
Отдельно отмечу пользу ГигаЧата для школьников и студентов. С его помощью они могут работать над проектами. ГигаЧат помогает создавать контент, с ним можно обсудить фрагменты будущего материала, продумать его структуру и содержание.
То есть сервис по-прежнему часто используют для обучения и работы с информацией?
Освобождение от рутины — ключ к повышению продуктивности. Это подтверждают многочисленные исследования: когда у человека исчезают однообразные задачи, он может полностью сосредоточиться на профессиональных целях. Предприниматели перестают тратить время на отчеты и посвящают себя развитию бизнеса. Сотрудники компаний осознают, что их ключевая задача заключается не в оформлении документов, а в создании новых продуктов, сервисов и креативных решений.
ГигаЧат отлично справляется с этой ролью: он генерирует тексты, оформляет служебные записки, работает с таблицами и отчетами, закрывая огромный пласт рутинных операций. Более того, оценив эффективность модели в офисе или вузе, пользователи активно применяют его и в быту. Люди начинают использовать ее для составления списков покупок, получения рекомендаций по фильмам и книгам и многого другого.
Недавно команда научила ГигаЧат разговаривать с пользователями. Как технология превращает искусственный интеллект в полноценного собеседника и какие новые сценарии она открывает?
Представьте, что вы просто звоните другу, — теперь так же можно общаться и с ГигаЧатом. Новая голосовая функция позволяет произносить запросы вслух, не печатая ничего. Вместо сухого обмена сообщениями любой пользователь может вести с сервисом плавный диалог, как с человеком.
Получается, с ГигаЧатом можно не только говорить — его можно и слушать. Расскажите про функцию подкастов.
ГигаЧат объединяет самую широкую аудиторию, и мы заметили тренд: пользователи всех возрастов охотно слушают подкасты. Причины у каждого свои: нехватка времени, возможность слушать в дороге или просто предпочтение такого формата.
Однако классический подкаст — это готовая история, где человек — лишь пассивный слушатель. Мы же пошли дальше и дали нашим пользователям возможность не просто слушать, а создавать. С помощью ГигаЧата можно сгенерировать собственный подкаст. Любой пользователь может сам выбирать собеседников, настраивать голос интервьюера, его интонацию, темп и энергию. То есть можно делать персонализированный контент под каждого человека. Такого раньше не было.
Эра генеративного контента стремительно развивается. Расскажите о ключевых достижениях ГигаЧата в генерации видео и изображений. Как вы решаете задачу точного отображения текста на создаваемых картинках?
На AI Journey 2025 Сбер представил линейку моделей Kandinsky 5.0 для генерации изображений и видео. Они уже доступны в ГигаЧате. Модели Video Lite и Video Pro создают видео по текстовому описанию, причем версия Video Pro обеспечивает качество на уровне мировых лидеров. Модель Image Lite генерирует изображения с учетом русской культуры и визуальных традиций.
Мы добились существенного роста качества. И, что особенно важно, теперь модели корректно пишут текст на русском языке. В отличие от зарубежных систем, обученных преимущественно на англоязычных данных и часто допускающих ошибки при работе с кириллицей, наши модели изначально адаптированы под русский язык. Это открывает широкие возможности — от создания открыток до генерации поздравительных надписей и других визуальных материалов. По сути вопрос только в одном — воображении человека. Один из самых вдохновляющих примеров пришел буквально вчера от наших пользователей. Ребенок нарисовал принцессу, а ГигаЧат оживил рисунок, и принцесса начала танцевать. Такие истории — лучшая обратная связь!
Очень трогательная история, которая хорошо иллюстрирует, что ГигаЧат из инструмента становится помощником человека. Каким вы видите следующий шаг? ИИ, который не информирует, а действует — бронирует, покупает?
Теперь ГигаЧат может не только отвечать на вопросы, но и выполнять действия. Это стало возможным благодаря ИИ-агентам, каждый из которых умеет делать что-то конкретное: например, искать товары, бронировать услуги или управлять устройствами. Если мы вернемся к этому разговору через год, я, скорее всего, назову совсем другие сценарии — просто потому, что их станет на порядок больше.
Мы уже начали принимать заявки от партнеров — например, от представителей e-com и других индустрий. Они смогут подключать к ГигаЧату своих агентов или предлагать другие решения для интеграции. Поэтому чем больше партнеров мы подключим, тем больше ИИ-агентов мы сможем вывести в продукт. В результате мы кратно расширим спектр кейсов, где ГигаЧат действует как личный помощник: помогает подобрать, приобрести и оплатить товары или услуги.
Второй важный вектор — это развитие эмпатии во всех ее проявлениях. Мы работаем над тем, чтобы ГигаЧат научился точнее распознавать эмоции, реагировать на состояние и настроение человека. Часто людям просто нужно выговориться, но они не делают этого по разным причинам. Да, поначалу говорить с роботом может быть непривычно, но когда в ответ человек получает не бездушный текст, а живой, сопереживающий голос, — это меняет восприятие.
Поэтому наша цель в том, чтобы ГигаЧат оказывал не только функциональную, но и ментальную поддержку. Это именно то, что находится на стыке технологий и человечности.
