Генеративная модель Сбера Kandinsky подводит итоги прошлого года. По данным разработчиков, нейросеть создала более 200 миллионов генераций по текстовым запросам, а ее аудитория превысила 12 миллионов уникальных пользователей. Модель заняла первое место по темпу роста и стала второй после Stable Diffusion по популярности среди разработчиков по версии AI-ресурса Hugging Face, где собраны лучшие open source-решения.
Kandinsky понимает запросы из широкого списка тем более чем на 100 языках, пользователи могут создавать фотореалистичные изображения в неограниченном количестве, применяя самые разные стили. Модель также умеет менять отдельные объекты и целые области на картинке, смешивать несколько рисунков, дорисовывать изображение, создавать картины в режиме бесконечного полотна (inpainting/outpainting). Нейросеть хорошо знает отечественный культурный код: архитектурные достопримечательности, объекты и элементы народного искусства.
Кроме того, пользователи Kandinsky могут создавать четырехсекундные анимационные ролики и полноценные видео длиной до восьми секунд. Таким образом, генеративная модель Сбера помогает реализовать практически любую творческую задумку.
Оценить возможности нейросети можно на платформе fusionbrain.ai, в Telegram и в VK-ботах, на сайте rudalle.ru.
Модель работает в сервисе GigaChat, доступна в мобильных приложениях «СберБанк Онлайн» и «Салют», а также на умных устройствах Sber по голосовой команде «Запусти художника». Сгенерировать анимацию и видеоролики можно на платформе fusionbrain.ai и в Telegram-боте — для этого нужно оставить заявку на доступ.
Модель разработали и обучили исследователи Sber AI при партнерской поддержке ученых из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.