Друзья всем привет. В этой статье я хочу сравнить квантованные модели Flux Kontext
На данный момент есть следующие квантованные модели:
Скачать их можно с huggingface
Что такое квантование читайте в самом низу статьи, а мы возьмём вот такие входные изображения
Put on the headphones on the head of a woman. Save the style, and the face of a woman
Ниже представлены результаты генерации на моделях:
Как вы можете видеть, время загрузки gguf моделей в 2 раза быстрее, хотя время генерации одинаковое.
Квантованные модели имеют расширение gguf и выглядят как:
Оптимальный выбор — модели с квантованием Q4_K_M или Q5_K_M. Они обеспечивают хороший баланс между качеством и размером, отлично подходят для 8 ГБ VRAM.