Ernie Image + Turbo

Всем привет. На дворе апрель 2026 года, а Baidu тихо, без громких анонсов, выложили в открытый доступ кое-что интересное: ERNIE Image — 8B DiT-модель, которая с первых же бенчмарков залезла на самый верх таблиц среди open-weight text-to-image. Apache 2.0, коммерческое использование без ограничений, и — что совсем неожиданно от китайской команды — рекордная работа с текстом внутри изображений. Модель ориентирована на мультиязычность, но с акцентом на китайский язык. Самые лучшие результаты на китайском и английском языках, но и с русским она так же неплохо справляется.

На фоне привычной гонки «кто красивее сгенерит девушку на пляже» это выглядит как смена приоритетов: команда явно целилась не в художников-любителей, а в дизайнеров постеров, авторов комиксов и всех, кто устал от кривых букв на картинках.

Рынок визуальных моделей сейчас такой, что одним «хорошим качеством» уже не удивишь — нужна либо скорость уровня Z-Image Turbo, либо какая-то особенная фишка. У ERNIE Image эта фишка есть, и очень конкретная: текст внутри картинки, который можно читать. Постеры, инфографика, UI-макеты, комиксы с подписями — всё то, где Flux и SDXL традиционно роняют ложку.

Плюс к этому — встроенный Prompt Enhancer: лёгкий модуль, который автоматически разворачивает короткий промт в детальное описание. Никаких дополнительных телодвижений — просто пишешь кратко, модель сама дополняет.

Сравнивать будем с тем, с чем имеет смысл — с Z-Image Turbo и Qwen Image 2512, нашими текущими фаворитами.

Кинематографичная реалистичная фотография драматичного голубого неба, где большие пушистые кучевые облака естественно образуют надпись «МЕЧТАЙ СМЕЛО» в виде гигантских облачных букв, растянувшихся вдоль горизонта. Солнечный свет золотого часа освещает облачный текст снизу, придавая тёплые розово-оранжевые оттенки. Внизу обширный открытый пейзаж. Облачный текст должен быть чётко читаем. Широкоугольный объектив, разрешение 8k.

Кинематографичная реалистичная фотография слова «ИНФЕРНО», написанного крупными горящими огненными буквами, парящими над тёмной каменной поверхностью. Каждая буква полностью состоит из настоящего пламени с оранжевыми, жёлтыми и синими деталями огня, вокруг летят искры, тёмный драматичный фон, поднимаются струйки дыма. Текст должен быть идеально читаем. Стиль длинной выдержки, студийный свет, разрешение 8k, высокая детализация текстуры огня.

Кинематографичная реалистичная фотография уверенного шеф-повара в белом кителе рядом с деревянной меловой доской меню в уютном ресторане. На доске мелом написано в несколько строк:
«Сегодня в меню:
Грибной крем-суп — 350₽
Лосось на гриле — 890₽
Тирамису — 290₽
Работаем: 12:00 — 23:00″
Тёплое ресторанное освещение, боке-фон со свечами и столиками. Каждая строка текста на доске должна быть идеально читаема. Объектив 35 мм, разрешение 8k.

Кинематографичная реалистичная фотография молодой художницы перед огромным красочным граффити-муралом на кирпичной стене. На муале крупным граффити-шрифтом в три строки:
«ГОРОД
НИКОГДА
НЕ СПИТ»
Каждая строка в своём ярком цвете — синий, оранжевый, жёлтый — с художественными эффектами теней и декоративными элементами вокруг букв. Городской фон, свет золотого часа. Все три строки должны быть чётко читаемы. Объектив 35 мм, разрешение 8k.

Кинематографичная реалистичная астрофотография глубокого ночного неба, где яркие звёзды выстроены в двухстрочную вдохновляющую цитату в стиле созвездий на фоне Млечного Пути:
«ТЯНИСЬ К
ЗВЁЗДАМ.»
Буквы образованы настоящими светящимися звёздами, соединёнными слабыми линиями туманностной пыли. Фон глубокого космоса с видимыми галактиками. Точка в конце тоже должна быть чётко видна. Стиль ультрачёткой астрофотографии, разрешение 8k.

Кинематографичная реалистичная широкоугольная фотография драматичного неба на закате, где большие пушистые облака естественно образуют двухстрочный текст в стиле прогноза погоды:
«СОЛНЕЧНО +24°C
ВЕТЕР 12 км/ч»
Облачные буквы светятся тёплым розово-золотым светом снизу. Широкий пейзаж внизу, драматичная атмосфера. Обе строки со всеми числами, символами и знаком градуса должны быть идеально читаемы. Профессиональная пейзажная фотография, разрешение 8k.

Кинематографичная реалистичная макрофотография флэтлей на тёмной деревянной поверхности, где кофейные зёрна, палочки корицы и звёздочки аниса аккуратно выложены в трёхстрочный текст рецепта:
«ЭСПРЕССО:
18г / 30мл
25 сек.»
Каждый символ, включая цифры, слэш, двоеточие и точку, точно сформирован из кофейных зёрен. Тёплый мягкий студийный свет, малая глубина резкости. Весь текст включая каждый символ должен быть чётко читаем. Объектив 100 мм макро, разрешение 8k.

Кинематографичная реалистичная студийная фотография крупных ледяных скульптурных букв на тёмной отражающей поверхности, складывающихся в двухстрочное поздравление:
«С НОВЫМ
ГОДОМ!»
Каждая буква — монолитный блок кристально чистого льда с внутренними преломлениями, тающие капли, холодное сине-белое освещение, драматичные тени. Восклицательный знак тоже должен быть чётко выполнен в виде льда. Весь текст должен быть идеально читаем. Разрешение 8k, гиперреалистичная текстура льда.

Кинематографичная реалистичная аэрофотография строго сверху вниз на тёмный влажный песчаный пляж, где морские волны, набегая на берег, образуют трёхстрочный адрес из белой морской пены:
«ул. Морская, д.42
г. Сочи, 354000
Россия»
Включая номер дома, запятые, точки, индекс и символ солнца — всё из натуральной морской пены. Идеальная перспектива дрона сверху вниз, контраст белой пены и тёмного песка. Каждый символ включая цифры, запятые и эмодзи должен быть читаем. Разрешение 8k, свет золотого часа.

Кинематографичная реалистичная страница комикса на белом фоне.
Страница содержит ровно 3 панели, расположенные следующим образом:

МАКЕТ СТРАНИЦЫ:
— Левая сторона: ОДНА высокая вертикальная панель, занимающая всю левую половину страницы от верха до низа
— Правая сторона: ДВЕ горизонтальные панели, расположенные одна над другой, каждая занимает половину правой части страницы

ПАНЕЛЬ 1 — ЛЕВАЯ ВЕРТИКАЛЬНАЯ (полная высота, левая половина):
Драматичный полноростовой кадр молодой женщины-детектива в длинном тёмном плаще, стоящей в дождливом неоновом переулке ночного города. Она смотрит прямо на зрителя, в одной руке — светящееся досье. Видны полосы дождя, неоновые отражения на мокром асфальте. Подпись в рамке вверху панели: «Нео Токио. 2089 год.» Пузырь внизу: «В этом городе ничто не остаётся похороненным надолго.»

ПАНЕЛЬ 2 — ПРАВАЯ ВЕРХНЯЯ ГОРИЗОНТАЛЬНАЯ:
Крупный план руки детектива, держащей открытое голографическое досье с лицом подозреваемого и данными. На голографическом экране текст: «ПОДОЗРЕВАЕМЫЙ №7 — ЧЕН РАЙ | СТАТУС: ОПАСЕН | ПОСЛЕДНЕЕ МЕСТО: Сектор 9». Драматичное синее голографическое свечение. Подпись в рамке: «Это дело было засекречено 12 лет.»

ПАНЕЛЬ 3 — ПРАВАЯ НИЖНЯЯ ГОРИЗОНТАЛЬНАЯ:
Широкий кинематографичный кадр огромного футуристического ночного города с высоты — небоскрёбы с неоновой рекламой на русском и японском языке, летающий транспорт в небе, дождь и туман. Виден большой рекламный билборд с текстом: «ДОБРО ПОЖАЛОВАТЬ В БУДУЩЕЕ — НеоКорп™». Нарратив в углу: «Где-то там… он наблюдал.»

Все рамки панелей — чёткие жирные чёрные линии с одинаковыми отступами между панелями. Весь текст в пузырях, подписях и внутримировой текст (голографический экран, билборд) должны быть идеально читаемы. Профессиональный стиль комикса, кинематографический колор-грейдинг, тёмная нуар-атмосфера, разрешение 8k.

Кинематографичный реалистичный профессиональный дизайн киноафиши для научно-фантастического триллера. Полный вертикальный макет постера (портретная ориентация, соотношение 2:3).

Макет сверху вниз:
— Верхняя зона: Мелкий текст «PARAMOUNT PICTURES ПРЕДСТАВЛЯЕТ» тонкими заглавными буквами
— Верхняя середина: Крупный драматичный заголовок «ТЁМНЫЙ СИГНАЛ» огромными жирными серебристо-металлическими буквами с едва заметным свечением
— Центр: Одинокая женщина-астронавт в потрёпанном скафандре стоит на поверхности безлюдной инопланетной планеты, смотрит вверх на огромную треснувшую луну, заполняющую небо, драматичная контровая подсветка, пыльная буря у горизонта
— Нижняя середина: Слоган курсивом: «Некоторые двери лучше не открывать.»
— Нижняя зона: Три имени актёров средним жирным шрифтом: «ЭММА СТОУН РАЙАН ГОСЛИНГ КИЛЛИАН МЁРФИ»
— Самый низ: Строчка мелким шрифтом: «Режиссёр Дени Вильнёв | В кино с ноября 2026»
— Нижняя полоса: Стандартный блок мелкого правового текста киноафиши (lorem ipsum стиль, очень мелкий)

Все текстовые элементы любого размера — от огромного заголовка до мельчайшего текста — должны быть идеально читаемы. Кинематографический колор-грейдинг, тёмно-синие и серебристые тона, профессиональная типографика, разрешение 8k.

High-fashion style summer outfit infographic featuring color-coordinated floating elements arranged in an elegant expanded circular composition. It includes a breathable straw hat, a sleeveless organic cotton top, a flowing pleated skirt, handcrafted leather sandals, and a woven palm leaf handbag. Exquisite annotations highlight fabric breathability, refreshing texture, moisture-wicking properties, and seasonal comfort. The color palette adopts warm neutral tones—ivory white, terracotta, sand, and soft tan. Subtle dynamic trajectories and flowing fabric swirls suggest a gentle summer breeze, while bright natural sunlight creates soft shadows and sun-kissed sheen, in a Mediterranean style.