Улучшенная модель генерации изображений по текстовому описанию Kandinsky 3.1 теперь доступна всем пользователям без ограничений. Обновленная версия дообучена на датасете эстетичных изображений, что позволило повысить качество генерации картинок. Об этом сообщил первый заместитель председателя правления Сбербанка Александр Ведяхин в рамках международной промышленной выставки «ИННОПРОМ. Центральная Азия».
Узнайте больше в полной версии ➞«Первыми оценить возможности усовершенствованной версии нейросети Kandinsky 3.1 смогли в начале апреля дизайнеры, художники и блогеры. Мы получили много положительных отзывов и комментариев, которые помогли нам улучшить ее. С сегодняшнего дня Kandinsky 3.1 доступна всем пользователям. Она позволяет любому человеку реализовать свой творческий потенциал, а для профессионалов — это инструмент для более эффективного развития в креативной индустрии. Изображения, которые генерирует новая версия, поражают своей реалистичностью, креативностью и яркостью. Как и прежние версии, модель абсолютно бесплатна и доступна на разных поверхностях», — сказал он.
Так, была добавлена функция улучшения запроса (бьютификации), которая упрощает процесс создания изображений. Новая функция помогает создать детальный промпт за пользователя - достаточно написать несколько слов описания желаемого изображения, а языковая модель GigaChat Pro расширит и обогатит промпт деталями.
В новой версии улучшилась и функция inpainting, которая позволяет редактировать отдельные части изображения.
Кроме того, теперь есть возможность воспользоваться в основном Telegram-боте в том числе и быстрой моделью Kandinsky 3.1 Flash. Время генерации изображения c помощью этой версии модели по сравнению с базовой версией уменьшилось более чем в 10 раз.
В ближайшее время пользователям также будет доступна генерация изображений в 4K, функции создания вариаций изображения, смешивания нескольких картинок, смешивания картинок и текстов, генерации стикерпаков и возможность вносить локальные изменения на картинке, не меняя всей композиции сцены (ControlNet). Кроме того, очень скоро все пользователи смогут протестировать и обновленную версию модели генерации видео по тексту Kandinsky Video 1.1.
Модель разработана командой Sber AI при партнерской поддержке ученых из Института искусственного интеллекта AIRI на объединённых датасетах Sber AI и компании SberDevices.