Как рисовать картинки нейросетью Стейбл Диффужн

0 2058



По многочисленным просьбам радиослушателей, рассказываю, как получать от специально обученного робота забавные картинки на вольную тему — типа той, которую я прикрепил к посту. Кстати, с Теслой всё хорошо. Аппетит пришёл в норму, живёт нормальной кошачьей жизнью. Спасибо капитализму, нужный корм и нужные лекарства в ветклиниках есть.

Так вот, про нейросеть. Сейчас больше известна нейросеть Миджорни (Midjourney), однако она платная и неудобная, так как работает через молодёжный Дискорд. У меня есть деньги, но мне не нравится вот это ощущение счётчика, когда ты знаешь, что купил определённое количество картинок, и каждое нажатие кнопки «генерировать» обходится тебе во столько-то рублей. Поэтому я установил себе другую нейросеть, Стейбл Диффужн (Stable Diffusion), и играю с ней в безлимитном режиме, прямо на своём компьютере.

Вот инструкция по установке (ссылка). Всё бесплатно, хотя авторы и просят донат, на что, мне кажется, имеют полные моральные основания. Минимальные требования к работе — GeForce 10XX. Современные карты от AMD тоже работают (ссылка).

На моей карте (3090Ti) робот шуршит довольно быстро, генерируя одно фото за 3 секунды, однако диспетчер задач показывает, что видеокарта загружается при этом на несколько процентов. Подозреваю, что есть какой-то способ загрузить карту на 100%, и тогда нейросеть будет выплёвывать новые фото со скоростью печатного пресса, но мне этот способ неизвестен.

По настройкам я рекомендую поставить Generation Steps на 35, а Prompt Guidance — на 8. Первый параметр — число шагов, которые нейросеть сделает, всё глубже и глубже перерисовывая придуманную картинку. Если он низкий, получится слишком просто и туманно, если большой — слишком абстрактно. Второй параметр — позволенный роботу уровень свободомыслия. Чем выше, тем ближе к вашему запросу робот попытается сделать рисунок.

На практике, повторюсь, я рекомендую поставить 35 на 8 и дёргать ползунки только тогда, когда робот почти сгенерил уже что-то подходящее, и вы хотите слегка изменить полученную картину, чтобы превратить хороший результат в идеальный. Тогда можно переставить ползунки, например, на 45/8 или 40/10, а потом нажать на картинку другой кнопкой мыши и выбрать Re-Generate image with current settings. Нейросеть слегка перерисует картинку, возможно, продвинувшись в нужную вам сторону.

Переходим к запросам, которые вы пишете сверху слева, на английском языке, разделяя разные части запроса запятыми. Нарисуем, к примеру, кота. Пишем так:

- cat (кошка)
- steampunk (стиль)
- small street (задняя сцена)
- green (цветовая гамма)
- intricately detailed (замысловато детализированно)

Запрос: «cat, steampunk, small street, green, intricately detailed»

Реклама



Как видите, получается несколько простовато, как на проходной иллюстрации из старой цветной газеты. Добавим «by greg rutkowski», чтобы нейросеть сделала нам что-то в стиле Грега Рутковски, известного современного художника. Сразу выходит гораздо интереснее.

Запрос: «cat, steampunk, small street, green, intricately detailed, by greg rutkowski».



Ах, да, по умолчанию нейросеть делает изображение 512 на 512, и я советую не тратить время на попытки генерировать фото другого размера. Сначала добейтесь нужного вам результата на разрешении 512х512, а потом жмите другой мышкой, выбирайте «Post-Process Image, Apply Upscaling», и робот улучшит вам картинку до 1024х1024. Если вам внезапно нужен прямоугольник, то, нащупав на стандартных 512х512 хороший запрос, измените пропорции фото и генерите уже прямоугольники. С прямоугольниками нейросеть работает гораздо хуже, так что вы можете попросить ей, например, сделать сразу 100 фото (Amount Of Images To Generate) и уйти пить чай, а потом вернуться и быстро всё отсмотреть.

Но, повторюсь, я рекомендую не тратить время — квадрат 512х512, который одним движением детализируется до 1024х1024, для большинства целей достаточно хорош.

Итак, мы сделали стимпанковскую кошку. Добавим в запрос ещё кое-что — словосочетание «epic portrait» (эпический портрет), чтобы получить мощную, воодушевляющую композицию.

Запрос: «cat, steampunk, small street, green, intricately detailed, by greg rutkowski, epic portrait»



Перейдём для разнообразия в другой сеттинг. Сделаем кошку, пасущуюся на солнечном лугу (sunny meadow). Добавим также ей роскошную гриву (gorgeous mane) — уточнение, которое отлично подходит к большинству запросов.

Запрос: «cat, sunny meadow, gorgeous mane, intricately detailed»

Реклама



Опять не то — как любительское фото дачной кошки, испорченное неумелым фотошопом. Добавим «by Sir Peter Paul Rubens» (в стиле Рубенса). Конечно, я мог бы добавить и любого другого известного художника, от Петрова-Водкина до Боттичелли, нейросеть знает их всех.

Запрос: «cat, sunny meadow, gorgeous mane, intricately detailed, by Sir Peter Paul Rubens»



Перенесём нашу кошку в фантастический лес, изменим сцену на «dark forest» (тёмный лес), добавим «sunshine» (солнечный свет) и fantasy world (вымышленный мир). Наконец, добавим «by Artgerm», это ещё один художник.

Запрос: «cat, gorgeous mane, dark forest, sunshine, intricately detailed, fantasy world, by Artgerm»



С руками, как видите, незадача — это слабое место как настоящих художников, так и нейросетей. Можно взять эту картинку за основу и подёргать ползунок Generation Steps (как я указывал выше, потом надо выбрать Re-Generate Image With Current Settings). Конкретно с этой картинкой, впрочем, ничего хорошего у меня не вышло.



Интересные результаты даёт иногда слово Russian в запросе. Я добавил также к нему uniform (униформа) и fantasy digital art (цифровое искусство в стиле фэнтези). Вообще, сочетание «fantasy digital art» включите в свой арсенал, оно делает картинки более стильными.

Запрос: «russian cat, uniform, intricately detailed, epic portrait, fantasy digital art»



Наконец, попробуем скрестить кошку со свиньёй, перенеся место действия на цветочный луг.

Запрос: «halfpig cat, flower meadow, epic portrait, fantasy digital art, intricately detailed».

Реклама



Пожалуй, на сегодня хватит запросов, дальше уже пора испачкать руки в грязи и провести несколько экспериментов лично. Вот имена художников, стили которых вам, возможно, придутся по душе. Разумеется, их можно смешивать в одном запросе, указывая сразу нескольких:

- by Gustav Klimt
- by Nixeu
- by Wlop
- by Krenz Cushart
- by Artgerm
- by Greg Rutkowski
- by Alfons Mucha
- by Cameron Gray
- by John Gould
- by Weta Digital

Также попробуйте «saturated» (насыщенно) и «riot of colors» (буйство красок). Если получится что-то интересное, выкладывайте в комментарии, вот прямо в разрешении 1024х1024. И обязательно пишите текст запроса, чтобы мы понимали, как вам это удалось.

Олег Макаренко

Израиль не удержался от поставки вооружений в Восточную Европу, теперь эшелоны российских Су-35 устремятся в Иран
  • pretty
  • Сегодня 07:46
  • В топе

Тель-Авив пошел на рискованный шаг против России и теперь в страхе ждет у своих границ появления Су-35. Иран подтвердил, что приобрел эти истребители у РФ, и нет повода усомниться, что Тегеран примени...

В Люберцах семь мигрантов отмудохали местного. А из полиции они ... просто "сбежали"
  • Hook
  • Сегодня 15:55
  • В топе

Может кто-нибудь готов разъяснить, что означает эта фраза, но я ее реально не понимаю. Вернее, понимаю так, что в это просто поверить не могу. Вчера состоялся разговор Путина и Рахмона. По его ...

Оплата принимается кровью

«Сергей, что бы кто не прогнозировал, но наблюдаю усиление внимания Харьковскому направлению.Знаю, что для принятия решения необходим определенный алгоритм проверок. Но вот сегодня с ПВ...