Рабочая область программы Easy Diffusion
Ну и наконец полученный финальный результат (который нам больше подходит) нужно перевести в более высокое разрешение и сохранить его на нашем жестком диске для того, чтобы потом использовать его для дальнейшей работы. Для этого выполняем команду «Upscale» («Масштабировать»), наведя курсор мышки на рисунок.
Рабочая область программы Easy Diffusion
После этого выполняем команду «Download Image» («Скачать изображение»). Скачанное изображение будет с разрешением 2040 х 2048 пикселей на дюйм. Этого вполне достаточно, чтобы оформить обложку книги или сделать красивую открытку.
Поздравляю вас!
Вы создали свое первое уникальное изображение при помощи системы искусственного интеллекта Easy Diffusion, которое можно смело назвать маленьким произведением цифрового искусства.
В последующих главах книги мы узнаем много нового об искусственном интеллекте и повысим наш уровень знаний при работе с программой Easy Diffusion.
Шаг 6. Создаем красивое изображение
Как вы уже успели узнать из прошлой главы, система искусственного интеллекта Easy Diffusion может сделать новое уникальное изображение из текста, из другого изображения или из сочетания того и другого (при помощи команды «Use as Input» / «Использовать как входные данные»).
В этой главе мы с вами рассмотрим самый интересный вариант работы с системой Easy Diffusion – создание нового изображения из сочетания текста и другого изображения. Также мы уделим внимание написанию более сложного запроса.
Итак, начнем…
Для того чтобы создать изображение из текста, в окне «Enter Prompt» нам необходимо написать правильный текстовый запрос («Prompt»):
Окно «Enter Prompt» («Ввод запроса»)
Обратите внимание на то, что в окне «Enter Prompt» мы пишем не литературное описание той картинки, которую хотим получить, а именно запрос. Искусственный интеллект, с которым мы работаем, к сожалению, еще не читает наши мысли, и для него важно, чтобы мы говорили с ним на понятном ему языке. Уже большое достижение разработчиков заключается в том, что запрос пишется набором из ключевых фраз (состоящих из простых для понимания и человека, и машины слов), разделенных запятой, и исключительно на английском языке.
Давайте рассмотрим конкретный пример.
Мы создадим с вами изображение киборга с искусственным интеллектом.
Для этого выполним следующие действия:
– В окне «Enter Prompt» напишем следующую фразу на английском языке: «Artificial intelligence cyborg» («Киборг с искусственным интеллектом»). Если у вас возникли сложности с переводом, то рекомендую пользоваться помощью онлайн-переводчиков.
– Выберем алгоритм «Realistic Vision».
– Автоэнкодер (Custom VAE): vae-ft-mse-840000-ema-pruned. Автоэнкодер будет вам полезен в дальнейшей работе. Он помогает решить проблему с появляющимися артефактами и дефектами на лицах.
Найти файл можно в сети Интернет, а также скачать по ссылке:
https://huggingface.co/stabilityai/sd-vae-ft-mse-original/blob/main/vae-ft-mse-840000-ema-pruned.ckpt
Скачанный файл нужно перенести в папку:
С:\ EasyDiffusion\models\vae
или
D:\EasyDiffusion\models\vae
Если не получается найти и скачать файл, оставьте поле пустым.
– Sampler (Сэмплер): DPM++2s Ancestral (Kerras)
Все остальные параметры оставляем без изменений и жмем кнопку «Make image» («Создать изображение»).
Рабочая область программы Easy Diffusion
Давайте в окне «Enter Prompt» добавим небольшое уточнение про цвет глаз нашего киборга: «Artificial intelligence cyborg, green eyes».
Все остальные параметры оставляем без изменений и жмем кнопку «Make image».
В результате мы получим изображение, похожее на предыдущее, но уже цвет глаз киборга будет зеленым:
Рабочая область программы Easy Diffusion
Обратите, пожалуйста, свое внимание на то, что Easy Diffusion обрабатывает ваш запрос слева направо по порядку следования фраз, разделенных запятой.
Основная магия искусственного интеллекта заключается в том, что даже если вы все сделали так же, как я, то в большинстве случаев вы получите либо совсем другую картинку, либо очень похожую, при условии, что вы нажмете на кнопку «Make image» много раз.
Связано это с тем, что система Easy Diffusion каждый раз будет интерпретировать фразу «Artificial intelligence cyborg» как ей захочется, по причине того что наша ключевая фраза очень простая и носит общий характер, а также требует дополнительных уточнений.
Сделаем еще один шаг. В окне «Enter Prompt» добавим уточнение про цвет волос нашего киборга: «Artificial intelligence cyborg, green eyes, blue hair».
Все остальные параметры оставляем без изменений и жмем кнопку «Make image».
В результате мы получим изображение, похожее на предыдущее, но уже цвет волос киборга будет… зеленым:
Рабочая область программы Easy Diffusion
Как же так?
Мы же определили, что цвет волос должен быть голубым.
Для такого случая есть еще один полезный прием, который заставит искусственный интеллект обратить более пристальное внимание на наше уточнение про волосы.
Для этого в нашем запросе мы можем выставить приоритеты (соответствующие веса для фраз в интервале от 1 до 100), на которые система обратит особое внимание. Этот прием я позаимствовал из одного учебного курса[2 - Нейросеть Stable Diffusion. Обзор. Как пользоваться. Инструкция. [Электронный ресурс] supermicrostock.ru URL: https://supermicrostock.ru/stable-diffusion-obzor-how-to-use-guide/ (дата обращения: 28.08.2023).].
В окне «Enter Prompt» добавим веса для цвета глаз и цвета волос нашего киборга: «Artificial intelligence cyborg, green eyes:20, blue hair:80».
Все остальные параметры оставляем без изменений и жмем кнопку «Make image».
Рабочая область программы Easy Diffusion
Я использовал следующий синтаксис весов в запросе из соображения того, что, увидев текст «Artificial intelligence cyborg, green eyes:20, blue hair:80», система искусственного интеллекта будет обрабатывать его слева направо, но обратит особое внимание на то, что 20% своих усилий она должна отдать на рисование зеленых глаз, а 80% усилий направить на рисование голубых волос.
Должен сказать, что этот прием хоть и сработал (я проверил его много раз), но до конца я не уверен, что его использование является верным решением.