В этой статье я проведу систематическое тестирование взаимодействия двух ключевых параметров Stable Diffusion:
Разные семплеры требуют различного диапазона CFG Scale для оптимального результата. Одна из целей эксперимента выяснить какие методы семплирования производят «пережаренные» изображения при стандартных значениях CFG 7-10 и найти некую золотую середину, то есть то значение CFG при котором гененрировались качественные изображения при любом методе семплирования.
Для чистоты исследования все параметры, кроме CFG Scale, остаются неизменными для каждого конкретного семплера:
Prompt: portrait of a young woman with expressive details. she is dressed in a white linen shirt with an unbuttoned gate, through which a thin gold chain is visible. on her head is an elegant straw hat with a black ribbon. in her hands - a bouquet of wildflowers (chamomile, cornflowers and ears), tied by twine. a matte gold earring sparkles on the right ear
Negative prompt: infant, underage, young, child, teen, bad quality, worst quality, low quality, worst detail, deformed, bad hands, bad eyes, signature, username, logo, watermark, text, label, cartoon, illustration, anime, painting, CGI, 3D render
Steps: 3768410078
Sampler: DPM++ 2M, DPM++ SDE, DPM++ 2M SDE, DPM++ 2M SDE Heun, DPM++ 2S a, DPM++ 3M SDE, Euler a, Euler, LMS, Heun, DPM2, DPM2 a, DPM fast, DPM adaptive, Restart, HeunPP2, IPNDM, IPNDM_V, DEIS, DDIM, DDIM CFG++, PLMS, UniPC, LCM, DDPM
CFG-Scale: 1.5 - 10.5
Seed: 3768410078
Model: juggernautXL_version6Rundiffusion
DPM++ 2M
DPM++ SDE
DPM++ 2M SDE
DPM++ 2M SDE Heun
DPM++ 2S a
DPM++ 3M SDE
Euler a
Euler
LMS
Heun
DPM2
DPM2 a
DPM fast
DPM adaptive
Restart
HeunPP2
IPNDM
IPNDM_V
DEIS
DDIM
DDIM CFG++
PLMS
UniPC
LCM
DDPM
Максимальная «свобода» нейросети. Модель практически игнорирует промпт, полагаясь на свою внутреннюю интерпретацию данных. Результат напоминает абстрактную импрессионистскую живопись. Отсутствие четких контуров, мягкие цветовые градиенты.
Напоминает акварельные этюды, ранние эксперименты с нейросетевым искусством (2018-2020 гг.), фотографии с многократным экспозиционным наложением
Присутствуют типичные артефакты в виде исчезновения конкретных деталей из промпта, генерация случайных паттернов, потеря композиционной целостности (объекты «растворяются» в фоне)
Практическое применение. Несмотря на кажущуюся бесполезность, такой режим может быть полезен для создания абстрактных фонов и художественных экспериментов в стиле лирической абстракции
Умеренный стилизованный реализм.
При таких значениях в Stable Diffusion формируется наиболее сбалансированный и качественный результат. 6.5 можно считать «золотой серединой» для большинства семплеров. Изображения сохраняют:
При этом значения 5.5 – 6.5 я бы отнёс к живописному реализму, а 6.5 — 7.5 к фотореализму
При значениях CFG Scale 7.5–10.5 изображения в Stable Diffusion приобретают специфические характеристики, которые можно разделить на три ключевых диапазона:
CFG 7.5–8.5 Гипердетализированный фотореализм
Стилевые особенности:
Визуальные аналоги:
Рекомендуется для:
CFG 8.5–10.5 Контролируемая гиперболизация сюрреализм
Характерные черты:
Применение:
CFG Scale — мощный инструмент, требующий точной настройки под конкретную задачу.Идеальный CFG зависит от триады:
модель + семплер + тип промпта
Тестируйте в малых диапазонах (например, с шагом 0.5), чтобы найти «свой» оптимальный вариант.