Приложение «Шедеврум» от «Яндекса» может генерировать картинки, видео и тексты с помощью искусственного интеллекта (ИИ). В отличие от множества аналогичных сервисов, данная нейросеть хорошо понимает запросы пользователей на русском языке. «Лента.ру» рассказывает, как работает «Шедеврум», что умеет, а что нет, и кто может им пользоваться.
«Шедеврум» — это простой и бесплатный сервис «Яндекса», с помощью которого пользователи могут генерировать изображения, короткие видеоролики и тексты.
В его основе лежит нейросеть YandexART, которая формирует изображения по методу каскадной диффузии: то есть сперва создает картинки в соответствии с запросом, после чего поэтапно увеличивает их разрешение.
Прототип нейросети «Яндекс» презентовал 5 апреля 2023 года. Тогда она умела создавать только картинки по текстовому запросу пользователей.
Во время обучения первой версии генеративной модели для бета-теста разработчики использовали 240 миллионов примеров картинок с текстовыми описаниями. После выхода нейросети обучение продолжили на данных из 500 миллионов примеров — за счет этого получится добиться постепенного улучшения качества результатов в следующих версиях «Шедеврума».
У «Шедеврума» есть официальный сайт, однако он дает возможность лишь смотреть публикации других пользователей и ставить лайки.
«Шедеврум» прост в использовании. Он понимает запросы на русском, казахском и английском языках и в ответ на текстовые указания генерирует детализированные готовые изображения: чем точнее будет запрос, тем лучше результат.
Также нейросеть может работать в заданных художественных стилях: например, абстракционизме, минимализме, граффити и других.
Он чем-то напоминает Instagram (запрещенная в России соцсеть; принадлежит компании Meta, признанной экстремистской организацией и запрещенной в РФ) — пользователи могут подписываться друг на друга, ставить лайки сгенерированным картинкам, комментировать их и сохранять себе, а также публиковать собственные созданные нейросетью изображения.
Вместе с тем у «Шедеврума» есть лента, работающая на основе алгоритмов и показывающая пользователям те посты, которые могут их заинтересовать.
При этом под каждым изображением можно посмотреть запрос, на основе которого оно было создано.
Чтобы создать картинку, необходимо войти в приложение «Шедеврум» и нажать значок плюса, а затем выбрать «Изображение». В появившемся поле надо ввести описание картинки, которую хочется создать. Если нужно получить любое случайное изображение, достаточно нажать значок в виде двух звездочек — тогда ИИ придумает описание сам. Последний шаг заключается в том, чтобы кликнуть на кнопку «Сгенерировать». Теперь остается дождаться результата.
«Шедеврум» генерирует четыре картинки на выбор — одну или несколько из них можно будет опубликовать. При публикации изображение автоматически станет более четким и качественным. Если получившийся результат не устроил, можно нажать значок в виде двух круговых стрелочек, чтобы ИИ создал новые картинки.
Удалить свои творения тоже можно — для этого нужно нажать значок мусорной корзины. А вот сохранить их без публикации не получится.
Разработчики советуют при составлении запроса опираться на следующую структуру:
Фильтрумы — это креативные режимы, используя которые можно менять свои фото или изображения с помощью нейросети YandexART. Можно как выбрать готовые фильтрумы, так и настроить свои собственные.
Для начала необходимо нажать значок плюса и в разделе «Фильтрумы» кликнуть на «Ручной фильтрум», а затем выбрать из галереи смартфона фото, которое хочется изменить.
Далее остается придумать запрос, вписать его, нажать значок с двумя ползунками и установить нужные настройки:
Как только настройки будут установлены, можно нажимать «Готово», а затем — «Сгенерировать». Полученную картинку при необходимости есть возможность сравнить с исходной с помощью кнопки «Оригинал» — для этого надо ее зажать. Если получилось не то, что предполагалось, можно нажать на карандаш и изменить свой запрос.
За создание текстов отвечает встроенная в «Шедеврум» нейросеть YandexGPT. Что необходимо для ее использования?
Чтобы составить полный запрос, нужно опираться на следующие правила:
Если тяжело понять, как правильно сформулировать запрос, нейросеть может подсказать сама. Для этого нужно просто рассказать ей, какой результат необходим, например: «Мне нужно сделать анонс про выставку в картинной галерее для группы в «ВКонтакте». Что мне отправить, чтобы ты написала текст?»
Также лучше уточнить, от какого лица должен быть написан текст, то есть можно указать нейросети, какую роль она должна играть. Например: «Ты — ученик 7 класса. Напиши сочинение о том, как ты провел лето». Еще желательно отметить, для какой целевой аудитории этот материал создается — в данном примере «для учителя русского языка». Если в тексте должны быть конкретные ключевые слова, нужно их указать. И перечислить те фразы, которых, наоборот, быть не должно.
Опираясь на текстовый запрос пользователя, «Шедеврум» может создать ролик длительностью четыре секунды и частотой 24 кадра в секунду. Однако важно понимать, что это будет не совсем полноценное видео, а, скорее, анимированная картинка.
Для генерации нужно нажать на значок плюса и выбрать «Видео», а затем описать, что именно хочется видеть в ролике. Чем подробнее и детализированнее будет описание, тем релевантнее получится результат.
Затем нужно нажать «Сгенерировать» — «Шедеврум» предложит на выбор четыре картинки в качестве вариантов первого кадра ролика. Надо выбрать подходящую и определиться, какой анимационный эффект для создания движения больше подходит:
Также движение и поворот камеры по осям можно настроить самостоятельно — для этого достаточно выбрать эффект «Ручной». Как и фото, видео можно изменить, удалить или скачать. Ролик получится сохранить только в формате MP4.
Чтобы составить полный запрос, укажите:
Однако не стоит пренебрегать деталями. Видео получится более подробным, если они будут указаны. Например, можно уточнить цвета: «Сине-зеленый сосновый лес на красной земле».
Заложенные принципы работы с нейросетью не позволяют создавать контент по запросам, которые: