С новой версией генеративной модели Сбера — Kandinsky 2.2 — теперь можно создавать фотореалистичные изображения с более высоким разрешением и изменять соотношение сторон при генерации. Для дообучения нейросети использовался датасет в размере 1,5 миллиарда пар «текст — изображение». Это на 300 миллионов больше, чем в предыдущей версии — Kandinsky 2.1.
Новая версия модели научилась генерировать стикеры, из которых можно собирать полноценные стикерпаки в Telegram. Также бот Kandinsky 2.2 теперь способен изменять по текстовому описанию отдельные объекты или элементы на изображениях, сохраняя композицию исходной иллюстрации.
Kandinsky 2.2 понимает запросы на русском и английском языках, умеет рисовать более чем в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, дорисовывать недостающие части картинки, создавать картины в режиме бесконечного полотна.
«Мы продолжаем совершенствовать нашу нейросеть для создания уникального контента. Новая версия дает пользователям еще больше возможностей, при этом она генерирует изображения в еще лучшем качестве. Нейросеть уже не просто пытается подражать творчеству человека, а способна создавать новые художественные смыслы и интерпретации. Как и предыдущая версия, Kandinsky 2.2 находится в открытом доступе, так что протестировать ее можно совершенно бесплатно», — отметил первый заместитель председателя правления Сбербанка Александр Ведяхин.