Генерация человека в любой одежде

Друзья, представьте, что у вас есть фотографии платьев, костюмов, рубашек, халатов и других предметов одежды. Для их демонстрации требуется организовать фотосессии, что может быть долгим и затратным процессом. Вам нужно будет заплатить моделям, которые будут примерять каждую из вещей, а также фотографу, который будет делать снимки. Долго? Да. Дорого? Несомненно.

Что если я скажу вам, что это всё можно сделать при помощи Stable Diffusion? Эта нейросеть позволяет генерировать изображения с людьми в любой одежде без необходимости проводить настоящие фотосессии.

DeFooocus

Для генерации мы будем использовать DeFooocus, это форк набирающего популярность Fooocus v.2. Скачать DeFooocus можно по этой ссылке. В нём появилось много нового : Photopea (полноценный фотошоп), rembg (удаление фона) и ещё с десяток если не больше улучшений под капотом.

Не вижу смысла описывать весь функционал DeFooocus — это предмет отдельной статьи. Остановимся на том, что пригодиться нам для генерации человека в любой одежде.

Процесс генерации:

Первым делом нам нужно референсное изображение платья без фона, то есть с прозрачным фоном. Вы можете или найти в интернете уже без фона, что не всегда удается, или удалить фон. Для этого вы переходите на вкладку «rembg», загружаете или перетаскиваете туда изображение с одеждой и нажимаете Remove Background.

Ищем в интернете подходящую одежду
Ищем в интернете подходящую одежду
Нажимаем на Remove background, сохраняем
Нажимаем на Remove background, сохраняем
Листаем ниже и переключаемся на вкладку "Image Prompt"
Листаем ниже и переключаемся на вкладку "Image Prompt"
Во вкладке Image Prompt листаем в самый низ и ставим галочку "Advanced"
Во вкладке Image Prompt листаем в самый низ и ставим галочку "Advanced"
После этого, нам будут доступны ползунки. Stop At выставляем примерно на 0.85, а Weight на 0.94 и перетаскиваем сюда наше платье
После этого, нам будут доступны ползунки. Stop At выставляем примерно на 0.85, а Weight на 0.94 и перетаскиваем сюда наше платье

Что это за параметры ? Это параметры ControlNet — как видим у нас используется ControlNet «ImagePrompt», то есть он будет считывать промт из нашей картинки и остановится (Stop At) на 85%, при этом его вес (Weight) или сила будет составлять  94%

Сделано очень удобно. Перетащить вы можете как из вкладки rembg — если вы только что удалили фон, или из папки куда вы скачали изображение если фон уже удалён, так же вы можете скопировать ссылку на одежду, нажать на Click Upload и вставить её.

Далее пишем Prompt

				
					Beautiful blonde in the dress, against the backdrop of sunrise
				
			
Я написал «Красивая блондинка в платье, на фоне восхода солнца»

Взглянем на результат

Итог

Как вы можете наблюдать — результат просто шикарный, но что делать если мы хотим чтобы у нас было лицо определенной модели ? Я хочу чтобы примерить красное платье на Джулию Робертс и Милу Йовович (она мне нравилась в фильме Пятый элемент). Мы ничего не меняем в Prompt’е, просто добавляем лицо и выбираем модель FaceSwap

Загружаем нужно лицо во второе окно ControlNet, выставляем модель FaceSwap, параметр Stop At=1, параметр Weight=0.9
Загружаем нужно лицо во второе окно ControlNet, выставляем модель FaceSwap, параметр Stop At=1, параметр Weight=0.9

Это будет означать что модель FaceSwap будет считывать лицо из нашего загруженного лица полностью, т.е. до 100% и иметь вес 90%

Взглянем на результат

Как видите, несмотря на то что в промте написано «Красивая блондинка», он всё равно следует картинке, потому что Stop At указан единица и он до конца не будет отходить от картинки, и вес 0.9 что будет иметь довольно сильный вес.

Заключение

Заключение Использование Stable Diffusion для генерации изображений людей в одежде открывает новые горизонты для бизнеса в сфере моды и маркетинга. Это не только экономит время и деньги, но и дает возможность создавать уникальные визуальные образы без ограничений традиционной фотосъемки. Воспользуйтесь этой технологией уже сегодня и откройте для себя новые возможности в мире моды!