Промышленная версия первой в мире нейронной сети ruDALL-E от SberDevices и Sber AI, которая создает изображения на основе текстового описания на русском языке, появилась в доступе на платформе ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud. Она содержит 12 миллиардов параметров и подходит для создания коммерческих материалов: иллюстраций для рекламы, архитектурного и промышленного дизайна, векторных и стоковых изображений.
Узнайте больше в полной версии ➞ruDALL-E — мультимодальная нейросеть, которая генерирует оригинальные изображения по заданному русскоязычному описанию, моделируя совместное распределение текстов и изображений. Проект по обучению ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ. Модель существует в двух вариантах: сверхбольшой — ruDALL-E XL с 1,3 миллиарда параметров — можно воспользоваться бесплатно, загрузив ее код и набор параметров с Github. Гигантская же нейросеть ruDALL-E 12B XXL с 12 миллиардами параметров доступна в подборке ruGPT-3 & family DataHub ML Space и позволяет создавать неограниченное число новых изображений по заданному описанию с меньшей степенью абстракции и более высокого качества.
Изображение создается в несколько этапов: сперва нейросеть принимает описание на вход и генерирует заданное число картинок, затем другая выбирает максимально подходящие под описание, после чего они увеличиваются в размере без потери качества.
«Два месяца назад мы выложили в открытый доступ модель ruDALL-E XL, сделали демо-сайт и навык для ассистентов Салют, чтобы с ней можно было «поиграть», создавая любые картинки по запросу. Теперь же внешняя аудитория может воспользоваться и XXL-версией модели, которая позволяет получать не только абстрактные изображения, но и любое количество качественных уникальных иллюстраций, которые можно применять в разных сферах», — рассказал исполнительный вице-президент Сбербанка Давид Рафаловский.