Гонка по созданию нейросетей продолжается по всему миру, и Россия принимает в ней непосредственное участие. На днях «Яндекс» представил бета-версию приложения «Шедеврум» нейросети для генерации изображений по текстовому описанию с помощью нейросети. На данный момент это прототип, который создает скорее развлекательные изображения, но в скором времени, по заверениям компании, нейросеть сможет генерить баннеры, иллюстрации, изображения для интернет-витрин и не только. Всего за день работы приложение скачали более 130 тысяч раз, а в App Store «Шедеврум» возглавил рейтинг бесплатных приложений.
Нейросеть работает с русским и английским языками. При этом чем более подробным и детализированным будет запрос, тем качественнее получится результат. «Шедеврум» учитывает, например, такие особые пожелания пользователя, как «фотореализм» или «высокая детализация». После этого художественный ИИ от «Яндекса» формирует изображение, используя метод каскадной диффузии, — то есть сначала создает изображение в соответствии с запросом, а затем поэтапно увеличивает его разрешение, насыщая деталями. При этом нейросеть учитывает такие комментарии, как конкретизация художественных стилей или подражание конкретным живописцам. Для использования этой возможности в запрос нужно добавить пожелания по стилистике — например, «в стиле Василия Поленова» или «художественный реализм». Нелишним также будет уточнить качество будущей картинки. Как отмечают разработчики, «Шедеврум» очень любит конкретику.
Для начального обучения нейросети разработчики использовали базу из 240 миллионов изображений, а сейчас обучение продолжается уже на наборе данных из 500 миллионов примеров. Естественно, со временем и благодаря обучению нейросети качество получаемых изображений будет расти.
Руководитель управления машинного интеллекта и исследований «Яндекса» Алексей Гусаков отметил: «Мы пока в самом начале пути. В основе "Шедеврума" — прототип нейросети, которой предстоит многому научиться. Бета-тест приложения для пользователей — это новый опыт и немного хорошего настроения, для нас — возможность чуть лучше понять, в каком направлении развивать нейросеть дальше».
«Яндекс» не только создал сам «Шедеврум», но и сделал для него отдельное приложение, доступное пользователям в Google Play и App Store. Это существенно упрощает взаимодействие с нейросетью. На данный момент функционал приложения позволяет просматривать ленту уже созданных изображений и ставить оценки понравившимся. Самые популярные из них попадают в топ лучших картинок на отдельной вкладке. Также можно подать заявку на доступ к генерации, но придется подождать ее одобрения из-за большого количества желающих протестировать новую нейросеть. Со временем возможность создавать собственные шедевры получат все зарегистрированные пользователи.
Наличие ленты — это огромный плюс по сравнению с другими нейросетями. Ведь можно сразу же делиться изображениями с другими пользователями, а не только любоваться в одиночку получившимся результатом. Да и реакция в виде лайков поможет «Шедевруму» быстрее обучаться. Ибо нейросети, как любому художнику, важна обратная связь.
Важно отметить, что по результатам запроса пользователя «Шедеврум» выдает сразу четыре изображения, из которых можно выбрать то, которое понравится больше.
Пока в ленте изображений в большинстве своем встречаются картинки с запросами про «пять пальцев», «фотореалистичную селедку под шубой» и «суп с котом» — что, собственно, неудивительно, ведь подобные задачки, похоже, становятся стандартным способом проверки возможностей нейрохудожников. Однако при этом встречаются действительно интересные и качественно проработанные изображения. В первую очередь это пейзажи, выполненные в разной художественной стилистике.
Пока «Шедеврум» только учится и развивается, поэтому еще рано говорить о возможностях использования результатов его творчества в реальных рабочих процессах. Но будем надеяться, что использование в некоммерческих целях останется бесплатным. Ибо пример Midjourney на ограничение пользователям бесплатного пробного периода из-за обилия фотореалистичных изображений арестованных политиков не сильно радует. Кстати, в «Шедевруме» не генерируются изображения конкретных людей, чтобы не плодить дипфейки.
«Шедеврум» — первая бета-версия, и будет интересно следить за его дальнейшим развитием. А пока можно просто развлечься и создать интересную картинку, радоваться получившимся результатам и делиться этой радостью с окружающими. Как говорил один нарисованный Енот, «от улыбки станет всем светлей».