Интернет и СМИ
23:36, 25 июня 2024

Лучшие нейросети для генерации изображений: топ бесплатных инструментов для создания картинок по текстовому описанию

Екатерина Шатская
Фото: freepik

Нейронные сети совершили переворот в индустрии дизайна — теперь каждый может создавать качественные и реалистичные изображения, не обладая навыками художника или дизайнера. Нейросеть может генерировать изображения, опираясь лишь на заданные им слова, а также реставрировать старые фотографии и даже монтировать видеоролики. Сегодня нейросети активно используются художниками, дизайнерами, маркетологами и другими специалистами, для которых важна красивая картинка. «‎Лента.ру» рассказывает о лучших бесплатных нейросетях для генерации изображений и объясняет, как работают такие программы.

Как работают нейросети

Нейросеть — это математическая модель, построенная на принципах работы человеческого мозга. Она способна обучаться с помощью созданных человеком алгоритмов и поступающей в нее информации.

Вычислительные элементы нейросети обмениваются данными подобно нейронам в головном мозге. После того как информация поступает в нейросеть, начинается процесс обработки, каждый из тысяч нейронов отвечает за распознавание определенного критерия, осуществляет вычисления и передает результат следующему порядку нейронов. На выходе получается решение или прогноз, соответствующий запросу пользователя. В целом принцип работы нейросетей можно описать следующим образом.

Как работают нейросети:

Нейросети используются для анализа информации и сложных вычислений — то, на что человеку потребуются минуты, искусственный интеллект сможет вычислить намного быстрее. Спектр их применения очень широк: распознавание и синтез речи, прогнозирование предпочтений пользователей, управление роботами и дронами, анализ медицинских данных, генерация игрового контента и так далее.

Какие есть типы нейросетей

  • Полносвязные нейронные сети (Fully Connected Neural Networks) — все нейроны в одном слое связаны с каждым нейроном в следующем слое. Все входные сигналы поступают сразу ко всем нейронам. Такие сети используются для классификации и задач, где данные не имеют явной структуры.
  • Сверточные нейронные сети (Convolutional Neural Networks) — есть несколько групп нейронов, каждая из них занята вычислением конкретной задачи. Используются для обработки изображений и видео, имеют специализированные слои для работы с различными фильтрами.
  • Рекуррентные нейронные сети (Recurrent Neural Networks) — нейроны могут запоминать информацию и выстраивать дальнейший алгоритм на основе этих данных. Благодаря памяти такие нейросети способны запоминать последовательности.
  • Сети прямого распространения (Feedforward Neural Networks) — простейший вид нейросети, в процессе работы информация движется только вперед, от входного слоя к выходу. Такие программы часто используются для классификации и регрессии данных: распознавания возраста по фото, оценки стоимости, распознавания лиц и объектов.
  • Генеративно-состязательные сети (Generative Adversarial Networks, GANs) — комплекс двух сетей: генератора, создающего данные, похожие на те, что использовались при обучении, и дискриминатора, который отсеивает поддельную информацию от подлинной. Такие нейросети широко применяются для генерации картинок, видео и даже аудиодорожек.
  • Сети с остаточными соединениями (Residual Networks, ResNet) — такие программы включают в себя «‎пропускные» соединения, которые дают возможности сигналам обходить один или несколько слоев. Пропуск освобождает программу от осложнений и ускоряет ее обучение.

Как нейросеть рисует изображения

Может возникнуть впечатление, что нейросеть копирует фрагменты работ разных художников и соединяет их в новую картинку с учетом текстового запроса. На самом деле процесс генерации изображений с использованием нейронных сетей основан на так называемых генеративных алгоритмах.

Вначале нейросеть на большом наборе данных изучает особенности различных объектов и текстур. В нее загружают миллионы фотографий, рисунков и графики с подробным текстовым описанием, сеть анализирует данные, выявляет закономерности и затем запоминает полученную информацию в виде набора цифр. Генерация изображения происходит при помощи диффузионных моделей, которые генерируют изображения из случайного шума, а также создают данные, аналогичные тем, на которых обучаются.

Чтобы получить картинку, пользователь вводит промпт (в переводе с английского «prompt» — «подсказка, запрос») — короткое описание желаемого результата. Далее процесс генерации складывается из нескольких этапов.

Как нейросеть создает новые изображения:

  1. Искусственный интеллект интерпретирует промпт, введенный пользователем;
  2. На основе текстового запроса генерируется случайный шум, из которого затем создается изображение;
  3. Модель CLIP (Contrastive Language-Image Pre-Training) оценивает полученные результаты и показывает самые удачные из них, наиболее схожие с заданным текстовым описанием.

Иногда нейросеть создает совсем не то, что имел в виду пользователь, в таком случае нужно поработать над промптом: более подробно описать, что в итоге должно получиться и добавить необходимые детали.

Как правильно написать запрос

На итоговый результат влияет не столько выбранная нейросеть, сколько правильно сформулированный промпт, то есть четкий запрос.

Чтобы правильно написать запрос для нейросети, нужно учесть следующие моменты.

Как написать запрос для нейросети:

  1. Четко сформулировать, что должно быть изображено на картинке. Нейросеть плохо воспринимает абстракции, лучше, если это будет что-то конкретное: дом, гроза, красивая девушка и так далее. Также стоит указать основные цвета и действия объектов на картинке. Промпт должен содержать достаточно информации, чтобы нейросеть понимала, какой именно требуется результат. Например, «портрет молодой женщины с короткими волосами и красными губами, которая идет по улице в дождливый день».
  2. Писать кратко и ясно. Чтобы не запутать нейросеть и не затруднить ее работу, стоит избегать замысловатых и слишком длинных формулировок.
  3. Определить стиль изображения. У некоторых нейросетей есть возможность выбрать стиль, а некоторым его нужно прописывать. Наиболее популярные стили: фотореализм, абстракция, фэнтези, аниме, стиль известного художника, например, Сальвадора Дали или Пикассо.
  4. Генерировать заново или корректировать. Если результат получился неудовлетворительным, можно воспользоваться функцией дорисовки или редактирования, а также сгенерировать картинку заново, внося в промпт необходимые коррективы.
  5. Учитывать основной язык нейросети. Российские сервисы понимают русский язык, с зарубежными придется общаться на английском. При необходимости можно перевести промпт с помощью ChatGPT или обычного переводчика.

Некоторые нейросети работают и с антипромптами — в таком случае нужно описать то, чего не должно быть на генерируемом изображении

Топ бесплатных нейросетей для создания изображений

«Лента.ру» собрала бесплатные и условно бесплатные нейросети, которые доступны в России и не требуют оплаты зарубежной картой.

Kandinsky 3.1

Разработка Сбера, которая позволяет генерировать изображения и видео по описанию, дорисовывать загруженное изображение, а также смешивать разные картинки и переносить стиль.

Нейросеть понимает описания на русском языке, а также примерно на ста иностранных языках. В программе можно настроить соотношение сторон картинки (панорама 16:9, квадрат 1:1 или портрет 9:16), стиль (цифровая живопись, детальное фото или аниме) и другие параметры. В новую версию разработчики добавили функцию улучшения запроса (бьютификации), которая помогает создать детальный промпт за пользователя — человеку достаточно написать несколько слов описания, а языковая модель GigaChat Pro сама расширит и добавит в промпт детали.

Playground.AI

Работает на базе Stable Diffusion. Чтобы начать работу, необходимо зарегистрироваться через Google-почту. После регистрации сервис предложит пройти краткое обучение. В бесплатной версии доступны одна тысяча генераций в сутки, использование различных стилей, а также функция редактирования пользовательских картинок. Описания следует создавать на английском языке.

«Шедеврум»

Нейросеть от Яндекса, которая работает только в мобильном приложении. В веб-версии можно посмотреть готовые арты и промпты других пользователей.

Программа создает картинки по текстовому описанию или фото. На генерацию уходит довольно много времени — две-три минуты, зато картинки получаются яркими и детализированными. Чтобы сохранить созданную иллюстрацию, сначала ее нужно опубликовать в общей ленте, но затем пользователь может удалить ее. Особенность «Шедеврума» — креативные режимы «фильтрумы», которые позволяют редактировать собственные изображения с помощью нейросети YandexART.

Dream by WOMBO

Программа создает иллюстрации по текстовому запросу или на основе пользовательских референсов. Интерфейс прост в использовании: ввести промпт не более 350 символов, выбрать один из множества бесплатных стилей и нажать на кнопку «создать». Вариации стилей: от реализма, фэнтези, аниме и чернил до тату, студии «Гибли» и ретрофутуризма.

В бесплатной версии создается всего одно изображение, но на его генерацию уходят считаные секунды. Количество генерируемых изображений не ограничено.

Starryai

Требует залогиниться через аккаунт Google или Apple. После регистрации на счету появится пять «кредитов» — это значит, что у пользователя есть лишь пять попыток генерации в день, однако каждый раз программа выдает по четыре изображения на запрос (количество результатов можно увеличить до восьми, но тогда за одну генерацию программа снимет два «кредита»).

Программа проста в использовании — необходимо составить текстовый запрос или загрузить изображение, затем выбрать желаемый художественный стиль и сгенерировать картинку. Однако отредактировать изображение с помощью этой нейросети не получится.

Leonardo.AI

Для работы с программой требуется регистрация через e-mail, аккаунт в Google, Apple или Microsoft. После регистрации на счету пользователя появляются 150 токенов — это значит, что за день можно сгенерировать от 15 до 150 картинок, в зависимости от используемых функций и настроек. В бесплатной версии все созданные картинки будут публичными, в платной версии есть настройка приватности.

Особенность нейросети — возможность использовать ее как социальную сеть. Можно подписаться на работы других пользователей и выкладывать свои, также есть галерея готовых картинок, которые сейчас в топе и набрали наибольшее количество просмотров и лайков. Понравившиеся изображения сохраняются в отдельной папке, в дальнейшем их можно использовать в качестве источника вдохновения и подсматривать промпты.

Runway

Нейросеть, которая позволяет создавать короткие видеоролики — по факту это картинки с движущимся элементом. При регистрации пользователь получает 125 бесплатных «кредитов», на которые можно снять 105 секунд видео.

Runway часто используют для того, чтобы «оживить» уже имеющуюся иллюстрацию или фотографию, но она обязательно должна быть не защищена авторским правом — поработать с кадром из фильма не получится. Также нейросеть умеет создавать видео с нуля по текстовому промпту, но следует изучить правильный порядок его написания, например, обязательно указать действие, иначе картинка будет статична.

Почему нейросети популярны

Приложения на базе нейросетей, стали особенно популярны в 2023 году, после выхода нашумевшего Chat GPT от компании Open AI. По данным на конец 2023-го, 35 процентов мировых корпораций уже активно использовали ИИ в своей работе. В 2024 году общее число пользователей инструментов ИИ должно вырасти до 314 миллионов человек.

~ 314 млн
человек
пользуются инструментами ИИ в 2024 году

В связи с этим остро встал вопрос о том, заменит ли искусственный интеллект живых художников и дизайнеров? Эксперты утверждают, что пока нейросеть не способна к новаторству, и генерировать оригинальные идеи — по-прежнему задача художника. Кроме того, из-за неспособности искусственного интеллекта испытывать эмоции и чувства, результат, выданный нейросетью, вряд ли будет отличаться глубиной — маловероятно, что такое искусство может проникнуть в душу зрителя.

К тому же искусственный интеллект, как правило, использует загруженные в программу картинки, которые ранее созданы живыми художниками, отмечал в 2022 году глава студии компьютерной графики RE2 Альберт Хайбуллин.

Тем не менее интерес к нейросетям со стороны пользователей, в том числе и россиян, продолжает расти. В 2023 году аудитория ИИ-приложений в России увеличилась в 3,5 раза. Причем тогда самым популярным сервисом оказался уже упомянутый «Шедеврум».

Кстати, мужчины пользуются ИИ чаще, чем женщины, — сильный пол составляет около 60 процентов аудитории таких приложений. В среднем россияне проводят почти час в месяц, работая с искусственным интеллектом.

< Назад в рубрику