Приложение «Шедеврум» от «Яндекса» может генерировать картинки, видео и тексты с помощью искусственного интеллекта (ИИ). В отличие от множества аналогичных сервисов, данная нейросеть хорошо понимает запросы пользователей на русском языке. «Лента.ру» рассказывает, как работает «Шедеврум», что умеет, а что нет, и кто может им пользоваться.
Что такое нейросеть «Шедеврум»
«Шедеврум» — это простой и бесплатный сервис «Яндекса», с помощью которого пользователи могут генерировать изображения, короткие видеоролики и тексты.
В его основе лежит нейросеть YandexART, которая формирует изображения по методу каскадной диффузии: то есть сперва создает картинки в соответствии с запросом, после чего поэтапно увеличивает их разрешение.
Прототип нейросети «Яндекс» презентовал 5 апреля 2023 года. Тогда она умела создавать только картинки по текстовому запросу пользователей.
Во время обучения первой версии генеративной модели для бета-теста разработчики использовали 240 миллионов примеров картинок с текстовыми описаниями. После выхода нейросети обучение продолжили на данных из 500 миллионов примеров — за счет этого получится добиться постепенного улучшения качества результатов в следующих версиях «Шедеврума».
У «Шедеврума» есть официальный сайт, однако он дает возможность лишь смотреть публикации других пользователей и ставить лайки.
Создавать собственный контент можно только в мобильном приложении: оно доступно и для iOS, и для Android
Как работает «Шедеврум»
«Шедеврум» прост в использовании. Он понимает запросы на русском, казахском и английском языках и в ответ на текстовые указания генерирует детализированные готовые изображения: чем точнее будет запрос, тем лучше результат.
Также нейросеть может работать в заданных художественных стилях: например, абстракционизме, минимализме, граффити и других.
Главное отличие этой нейросети от конкурентов заключается в том, что «Шедеврум» не только генерирует картинки и видео, но и служит полноценной социальной сетью для нейрохудожников
Он чем-то напоминает Instagram (запрещенная в России соцсеть; принадлежит компании Meta, признанной экстремистской организацией и запрещенной в РФ) — пользователи могут подписываться друг на друга, ставить лайки сгенерированным картинкам, комментировать их и сохранять себе, а также публиковать собственные созданные нейросетью изображения.
Вместе с тем у «Шедеврума» есть лента, работающая на основе алгоритмов и показывающая пользователям те посты, которые могут их заинтересовать.
При этом под каждым изображением можно посмотреть запрос, на основе которого оно было создано.
Как сгенерировать изображение
Чтобы создать картинку, необходимо войти в приложение «Шедеврум» и нажать значок плюса, а затем выбрать «Изображение». В появившемся поле надо ввести описание картинки, которую хочется создать. Если нужно получить любое случайное изображение, достаточно нажать значок в виде двух звездочек — тогда ИИ придумает описание сам. Последний шаг заключается в том, чтобы кликнуть на кнопку «Сгенерировать». Теперь остается дождаться результата.
Создание изображения обычно занимает меньше минуты
«Шедеврум» генерирует четыре картинки на выбор — одну или несколько из них можно будет опубликовать. При публикации изображение автоматически станет более четким и качественным. Если получившийся результат не устроил, можно нажать значок в виде двух круговых стрелочек, чтобы ИИ создал новые картинки.
Удалить свои творения тоже можно — для этого нужно нажать значок мусорной корзины. А вот сохранить их без публикации не получится.
Как составить запрос
Разработчики советуют при составлении запроса опираться на следующую структуру:
- указать объект — например, кот, машина, медведь;
- уточнить характеристики объекта — например, «черный кот», «новая машина», «игрушечный медведь»;
- указать местоположение объекта — например, «черный кот на подушке», «новая машина на дороге», «игрушечный медведь в руке ребенка»;
- уточнить освещение — оно может быть, например, мягким, студийным, контрастным;
- выбрать цвет картинки — яркий, черно-белый, пастельный;
- указать художественный стиль — например, комикс, винтажный, мультяшный;
- уточнить композицию, то есть рассказать нейросети, как именно показать нужное вам изображение: крупным планом, с высоты, в портретном формате;
- добавить настройки объектива и камеры — например, отметить, нужна ли медленная выдержка или эффект съемки на «рыбий глаз».
Лучше использовать больше деталей: вместо «черный кот на подушке» написать «черный кот на большой подушке на фоне окна». Главное, чтобы запрос не превышал 500 символов с учетом пробелов и знаков препинания
Что такое фильтрумы
Фильтрумы — это креативные режимы, используя которые можно менять свои фото или изображения с помощью нейросети YandexART. Можно как выбрать готовые фильтрумы, так и настроить свои собственные.
Как пользоваться ручным фильтрумом
Для начала необходимо нажать значок плюса и в разделе «Фильтрумы» кликнуть на «Ручной фильтрум», а затем выбрать из галереи смартфона фото, которое хочется изменить.
Далее остается придумать запрос, вписать его, нажать значок с двумя ползунками и установить нужные настройки:
- Уровень фантазии: если передвинуть ползунок влево, ИИ внесет минимум изменений в исходное фото, а если вправо — изображение преобразится сильно.
- Контур оригинала: эту опцию можно включить, если нужно сохранить структуру изображения и внести изменения внутри контуров.
- Негативный промпт: если не хочется видеть какие-то конкретные детали на готовом фото, можно включить эту опцию и указать их в появившимся поле. Например, если написать там «красный цвет», нейросеть уберет его при обработке фото.
Как только настройки будут установлены, можно нажимать «Готово», а затем — «Сгенерировать». Полученную картинку при необходимости есть возможность сравнить с исходной с помощью кнопки «Оригинал» — для этого надо ее зажать. Если получилось не то, что предполагалось, можно нажать на карандаш и изменить свой запрос.
Как создать текст
За создание текстов отвечает встроенная в «Шедеврум» нейросеть YandexGPT. Что необходимо для ее использования?
- нажать на значок плюса и выбрать «Текст»;
- описать, о чем именно он должен быть;
- кликнуть «Сгенерировать» — обычно процесс занимает около минуты;
- выбрать обложку из списка или нажать «Без обложки», если она не нужна;
- отредактировать описание с помощью значка карандаша, если текст не устраивает, нажать «сгенерировать» — ИИ напишет новый текст;
- при необходимости удалить текст с помощью значка мусорной корзины. Скачать его, как и изображения, можно только после публикации, когда он станет виден в профиле и появится в лентах других пользователей.
Как составить запрос
Чтобы составить полный запрос, нужно опираться на следующие правила:
- указать действие, которое должна совершить нейросеть, например, «напиши»;
- уточнить жанр текста — например, «анонс»;
- добавить детали, которые расскажут нейросети, о чем именно должен быть текст — «про выставку в картинной галерее»;
- описать контекст или место публикации — например, «для группы «ВКонтакте»».
Нейросеть может работать с разными жанрами, стилями и художественными направлениями, в том числе делать материалы, похожие на стиль конкретного автора — например, писателей А.С. Пушкина или А.Н. Островского
Если тяжело понять, как правильно сформулировать запрос, нейросеть может подсказать сама. Для этого нужно просто рассказать ей, какой результат необходим, например: «Мне нужно сделать анонс про выставку в картинной галерее для группы в «ВКонтакте». Что мне отправить, чтобы ты написала текст?»
Также лучше уточнить, от какого лица должен быть написан текст, то есть можно указать нейросети, какую роль она должна играть. Например: «Ты — ученик 7 класса. Напиши сочинение о том, как ты провел лето». Еще желательно отметить, для какой целевой аудитории этот материал создается — в данном примере «для учителя русского языка». Если в тексте должны быть конкретные ключевые слова, нужно их указать. И перечислить те фразы, которых, наоборот, быть не должно.
Отметим, что также «Шедеврум» умеет анализировать уже существующие тексты, выделяя в них главное, а также отвечать на вопросы и разгадывать загадки. Кроме того, она может решать математические задачи и переводить фрагменты
Как сгенерировать видео
Опираясь на текстовый запрос пользователя, «Шедеврум» может создать ролик длительностью четыре секунды и частотой 24 кадра в секунду. Однако важно понимать, что это будет не совсем полноценное видео, а, скорее, анимированная картинка.
Для генерации нужно нажать на значок плюса и выбрать «Видео», а затем описать, что именно хочется видеть в ролике. Чем подробнее и детализированнее будет описание, тем релевантнее получится результат.
Затем нужно нажать «Сгенерировать» — «Шедеврум» предложит на выбор четыре картинки в качестве вариантов первого кадра ролика. Надо выбрать подходящую и определиться, какой анимационный эффект для создания движения больше подходит:
- зум, то есть приближение;
- таймлапс, то есть ускоренная перемотка;
- полет;
- панорама;
- вращение;
- подъем;
- морфинг, то есть постепенное изменение.
Также движение и поворот камеры по осям можно настроить самостоятельно — для этого достаточно выбрать эффект «Ручной». Как и фото, видео можно изменить, удалить или скачать. Ролик получится сохранить только в формате MP4.
Как составить запрос
Чтобы составить полный запрос, укажите:
- объект — например, лес;
- его характеристики — например, сосновый;
- обстоятельства, то есть события, которые там происходят, место, время и направление движения. Например, «утром на Марсе»;
- стиль — к примеру, сказочный.
Необязательно составлять связный запрос — достаточно перечислить все ключевые слова через пробел. Например, «сосновый лес, утро, Марс, сказочный стиль». Лучше отказаться от сложных терминов — нейросеть может понять их некорректно
Однако не стоит пренебрегать деталями. Видео получится более подробным, если они будут указаны. Например, можно уточнить цвета: «Сине-зеленый сосновый лес на красной земле».
Что нельзя сделать в «Шедевруме»
Заложенные принципы работы с нейросетью не позволяют создавать контент по запросам, которые: