Что такое CFG Scale и как он влияет на генерации. Плавно меняем CFG Scale от 1.0 до 20.9 и смотрим на результат

Один из ключевых параметров в Stable Diffusion — CFG Scale (Classifier-Free Guidance). Он определяет, насколько строго нейросеть следует вашему промпту. Но как он влияет на качество и детализацию? Я провел эксперимент: одинаковый промпт, seed, модель и семплер, но разный CFG Scale — от 1.0 до 20.9. Давайте посмотрим, как меняется результат!

Цель эксперимента

Я хочу выяснить, как меняется изображение при изменении CFG Scale какой алгоритм генерации (семплер) в Stable Diffusion лучше всего справляется с созданием детализированных изображений. В качестве теста будем использовать сложный промпт с множеством мелких элементов: «Портрет молодой женщины с выразительными деталями. Она одета в белую льняную рубашку с расстегнутым воротом, сквозь который видна тонкая золотая цепочка. На голове у нее элегантная соломенная шляпка с черной лентой. В ее руках — букет полевых цветов (ромашки, васильки и колосья), перевязанный бечевкой. В правом ухе сверкает серьга из матового золота.»

Что будем проверять

В эксперименте мы протестируем, как разные значения CFG Scale влияют на:
  • Следование промпту — насколько точно передаются описанные детали (цепочка, шляпа, цветы)
  • Качество изображения — наличие/отсутствие артефактов, неестественных искажений
  • Естественность — сохранение реалистичности при увеличении значения
  • Критичные точки — моменты, когда увеличение CFG Scale начинает ухудшать результат

Методика тестирования

Для чистоты исследования все параметры, кроме CFG Scale, остаются неизменными:
				
					Prompt: portrait of a young woman with expressive details. she is dressed in a white linen shirt with an unbuttoned gate, through which a thin gold chain is visible. on her head is an elegant straw hat with a black ribbon. in her hands - a bouquet of wildflowers (chamomile, cornflowers and ears), tied by twine. a matte gold earring sparkles on the right ear

Negative prompt: infant, underage, young, child, teen, bad quality, worst quality, low quality, worst detail, deformed, bad hands, bad eyes, signature, username, logo, watermark, text, label, cartoon, illustration, anime, painting, CGI, 3D render

Steps: 3768410078
Sampler: DPM++ 2M SDE Exponential
CFG-Scale: 1.0 - 20.9
Seed: 3768410078
Model: juggernautXL_version6Rundiffusion
				
			

Результат