Мы провели прямое сравнение GPT-Image-1.5 и Imagine 4 Ultra на одинаковых входных промптах — без адаптации под конкретную модель, без трюков и без «улучшайзеров». Цель простая: проверить prompt obedience, чистоту композиции и предсказуемость результата в типовых задачах — рекламный баннер и превью для видео.
Ниже — исходные промпты (как есть), затем результаты по каждой модели и выводы, которые важны для практики.
Исходные промпты (без оптимизации)
Промпт №1: рекламный баннер с котами
A clean advertising banner featuring three domestic cats sitting side by side.
The cats are realistic, well-groomed, and clearly visible, facing the camera.
Each cat has a distinct fur color: one ginger, one gray, one black-and-white.
All cats are calm and neutral in expression.
Minimal studio background, light neutral color.
Soft studio lighting, no harsh shadows.
Shallow depth of field, focus on the cats.
Centered composition, horizontal banner format.
No text, no logos, no graphic elements.
No additional objects, no props, no decorations.
Photorealistic style, high detail, natural proportions.
Промпт №2: превью к видео про попугаев
A video thumbnail-style image featuring two parrots perched on a branch.
The parrots are colorful and realistic, clearly separated from the background.
One parrot is predominantly green, the other has red and blue feathers.
Both parrots are looking slightly toward the camera.
Natural outdoor lighting, soft daylight.
Background is blurred tropical foliage, not distracting.
Medium close-up framing, subject fills most of the frame.
Clean composition suitable for a video preview.
No text, no captions, no symbols, no borders.
No extra animals, no additional objects.
Photorealistic style, sharp focus on the parrots, balanced colors.
Результаты: Imagine 4 Ultra
Imagine 4 Ultra уверенно отрабатывает «фотореалистичную» часть запроса, но интерпретирует задачу более свободно. На обоих промптах модель стремится усилить выразительность кадра: добавляет визуальную плотность, повышает контраст, делает фон более активным. Из-за этого результат выглядит эффектнее, но местами хуже соответствует утилитарной цели — баннеру и превью.
Что получилось: попугаи (Imagine 4 Ultra)
Модель усиливает контраст и «киношность»: фон заметно активнее, картинка воспринимается как арт/сцена, а не как нейтральное превью.
Что получилось: баннер с котами (Imagine 4 Ultra)
Детализация высокая, композиция соблюдена, но кадр становится «тяжелее» за счёт визуальной плотности — ощущение скорее фотосессии, чем чистого рекламного макета.
Результаты: GPT-Image-1.5
GPT-Image-1.5 показал более «инженерное» поведение: чище фон, спокойнее цвет, аккуратнее композиция. Модель меньше импровизирует, лучше держит границы сцены и заметно реже добавляет лишние элементы. В итоге результат выглядит менее «эффектно», но чаще попадает в практическую задачу.
Что получилось: попугаи (GPT-Image-1.5)
Более предсказуемое превью: птицы чётко отделены от фона, фон размытый и не спорит с объектом, композиция спокойнее.
Что получилось: баннер с котами (GPT-Image-1.5)
Чистый студийный баннер: ровный свет, нейтральный фон, симметрия и хорошая читаемость — выглядит как заготовка под рекламу без лишней стилизации.
Анализ: в чём реальная разница моделей
В этом тесте разница проявилась не в «качестве картинки», а в философии генерации и приоритетах модели. Imagine 4 Ultra чаще стремится улучшить сцену визуально: усиливает выразительность, добавляет глубину и драматизацию. GPT-Image-1.5, наоборот, чаще удерживает рамки технического задания и делает более спокойную, предсказуемую композицию.
1) Prompt obedience и контроль сцены
GPT-Image-1.5 в среднем лучше держит ограничения: нейтральный фон, отсутствие лишних объектов, чистая композиция. Imagine 4 Ultra чаще «обогащает» сцену — это может быть плюсом для креатива, но минусом для макетов, где важна управляемость.
2) Полезность в реальных задачах
Для баннеров и превью важнее не художественность, а читаемость, чистый фон и правильные акценты. В этом сценарии GPT-Image-1.5 выглядит более подходящим как базовая модель для прикладных визуалов. Imagine 4 Ultra лучше проявляет себя там, где нужна выразительность и «картинка с характером».
3) Почему одинаковый промпт даёт разные результаты
Даже один и тот же текст воспринимается моделями по-разному, потому что внутри у них разные «приоритеты»: одна чаще максимизирует визуальную насыщенность, другая — управляемость. Поэтому в генерации изображений структура запроса важнее, чем кажется: камера, ограничения сцены, свет и запреты часто решают больше, чем сюжет.
Если хочется получать стабильные результаты и меньше зависеть от «характера» конкретной модели, полезно собирать промпт структурно: фиксировать камеру, сцену, стиль и ограничения. Для этого можно использовать наш генератор AI-промптов как стартовую точку — он помогает не забывать параметры, которые чаще всего ломают результат.
Выводы
- GPT-Image-1.5 в этом тесте показал более управляемую и прикладную генерацию: чистый фон, спокойная композиция, меньше лишних решений.
- Imagine 4 Ultra чаще усиливает кадр и стремится сделать визуально эффектнее, что полезно для креативных концептов, но не всегда идеально для макетов.
- Одинаковый промпт не гарантирует одинаковый результат: ключевую роль играет prompt obedience и внутренние приоритеты модели.
- Для предсказуемого результата важнее всего структура: камера, сцена, свет, запреты и границы генерации.