Параметры GPT Image 2.0: разбор настроек генерации изображений

GPT Image 2.0 — одна из самых мощных моделей генерации изображений по тексту прямо сейчас. Но мощь модели — это только половина успеха. Вторая половина — знать, какие параметры крутить и зачем. В этом разборе разложим по полочкам каждую настройку: что она делает, какие значения принимает и когда что выбирать.

Параметры GPT Image 2.0: обзор всех настроек

API генерации изображений принимает несколько ключевых параметров. Вот полная сводка перед детальным разбором каждого:

Параметр	Допустимые значения	Что контролирует
model	gpt-image-1, dall-e-3, dall-e-2	Модель генерации
size	1024×1024, 1536×1024, 1024×1536, auto	Разрешение и ориентация
quality	low, medium, high, auto	Качество и детализация
n	1–10	Количество вариантов
response_format	url, b64_json	Формат возврата изображения
background	transparent, opaque, auto	Прозрачность фона
output_format	png, jpeg, webp	Формат файла на выходе
output_compression	0–100	Степень сжатия (jpeg/webp)
moderation	auto, low	Строгость фильтрации контента

Параметр size — размер и ориентация изображения

Это первое, что нужно решить до генерации. GPT Image 2.0 поддерживает три фиксированных размера и режим auto:

1024×1024 — квадрат. Универсальный формат: аватары, постеры, иконки, посты в соцсети с квадратными превью.
1536×1024 — горизонталь (landscape). Идеально для обложек статей, баннеров, пейзажей, кинематографичных кадров.
1024×1536 — вертикаль (portrait). Подходит для портретов, сторис, мобильных обоев, книжных обложек.
auto — модель сама выбирает размер на основе промпта. Удобно при прототипировании, но непредсказуемо в продакшне.

Практический совет: если промпт описывает широкую сцену («панорама города», «кинематографичный кадр»), выбирай 1536×1024. Для портрета человека — 1024×1536. Для всего остального начинай с квадрата.

Параметр quality — качество и детализация

Один из самых важных параметров, напрямую влияющий на детализацию, время генерации и стоимость запроса.

low — быстрая генерация, минимум деталей. Подходит для быстрых набросков и проверки идей промпта.
medium — баланс скорости и качества. Хороший выбор для прототипирования и большинства задач.
high — максимальная детализация, лучшее следование промпту, точная прорисовка текстур и мелких деталей. Выбирай для финального результата.
auto — модель сама решает, достаточно ли задачи требуют высокого качества.

Правило большого пальца: разрабатывай промпт на low или medium, финальную версию рендери на high. Так экономишь время и деньги на итерациях.

Параметр n — количество вариантов за один запрос

Параметр n задаёт, сколько изображений модель сгенерирует за один вызов API. Допустимые значения: от 1 до 10.

n=1 — стандарт для большинства задач. Одна генерация, одна оплата.
n=2–4 — когда нужно выбрать лучший вариант из нескольких. Эффективнее, чем делать 4 отдельных запроса.
n=5–10 — для A/B-тестирования визуальных концепций или когда промпт намеренно оставлен расплывчатым ради разнообразия.

Важно: все изображения в одном запросе генерируются с одним и тем же промптом, но с разными случайными «зёрнами» (seed). Результаты будут похожи по концепции, но отличаться в деталях.

Параметр response_format — как получить изображение

Параметр определяет, в каком виде API вернёт результат:

url — API возвращает временную ссылку на изображение. Удобно для быстрого просмотра и отображения в браузере. Ссылки живут ограниченное время (как правило, 60 минут), поэтому сохраняй файл сразу.
b64_json — API возвращает изображение в кодировке Base64 прямо в JSON-ответе. Нужно для хранения без промежуточного сервера, для передачи в следующий шаг пайплайна или для серверных приложений, где нельзя делать внешние запросы к временному URL.

Когда что выбирать: для фронтенда и быстрых демо — url. Для бэкенд-пайплайнов и продакшн-приложений — b64_json.

Параметр background — прозрачный фон

Это один из самых ценных параметров GPT Image 2.0 для профессиональных задач. Позволяет генерировать изображения сразу с прозрачным фоном — без постобработки.

transparent — фон будет прозрачным (PNG с альфа-каналом). Идеально для стикеров, UI-элементов, логотипов, иллюстраций для наложения на другой контент.
opaque — непрозрачный фон. Стандартное поведение.
auto — модель решает сама на основе промпта и типа изображения.

Важно: параметр background=transparent работает только в связке с output_format=png или output_format=webp. JPEG не поддерживает альфа-канал, поэтому прозрачность с ним невозможна.

Параметры output_format и output_compression — формат файла

Эти два параметра определяют итоговый формат изображения и степень его сжатия.

output_format

png — без потерь, поддерживает прозрачность. Лучший выбор для иллюстраций, логотипов и всего, где важна чёткость краёв.
jpeg — сжатие с потерями, меньший размер файла. Подходит для фотореалистичных изображений без прозрачного фона.
webp — современный формат: лучшее сжатие при сопоставимом качестве, поддерживает прозрачность. Оптимален для веба.

output_compression

Работает только для jpeg и webp. Принимает значения от 0 до 100:

0 — максимальное сжатие, минимальный размер файла, заметные артефакты.
100 — минимальное сжатие, максимальное качество, большой файл.
75–85 — золотая середина для большинства задач: хорошее качество при приемлемом размере.

Задача	Рекомендуемый формат	compression
Логотип / стикер	png или webp	—
Фото для статьи	jpeg или webp	80–85
Баннер для сайта	webp	80
Финальный рендер для печати	png	—

Параметр moderation — строгость фильтрации контента

GPT Image 2.0 встроенно фильтрует запросы, нарушающие правила OpenAI. Параметр moderation позволяет немного управлять этим поведением:

auto — стандартная фильтрация. Подходит для большинства случаев.
low — чуть менее строгая фильтрация для платформ, которые сами обеспечивают контроль контента. Используется с осторожностью и только при наличии соответствующих прав доступа.

Для обычных задач — оставляй auto и не думай об этом параметре.

Редактирование изображений: параметры edit и inpaint

Помимо генерации с нуля, GPT Image 2.0 поддерживает редактирование существующих изображений. Для этого используется эндпоинт /images/edits с дополнительными входными данными:

image — исходное изображение, которое нужно изменить.
mask — маска в формате PNG с альфа-каналом. Прозрачные области маски — зоны, которые модель будет перерисовывать. Непрозрачные — зоны, которые остаются без изменений.
prompt — описание того, что должно появиться в области маски.

Типичный сценарий inpaint: есть фото комнаты, нужно заменить диван. Накладываешь маску на диван, пишешь промпт «modern minimalist sofa in light grey color» — модель перерисовывает только эту область, сохраняя остальное.

Если хочешь подробнее разобраться с промптами для GPT Image 2.0, загляни в статью Промпты для GPT Image 2: полный гайд с 30 примерами на все случаи жизни.

Пример итогового запроса с оптимальными параметрами

Вот как выглядит хорошо настроенный вызов API для генерации финального изображения:

{
  "model": "gpt-image-1",
  "prompt": "A minimalist product photo of a white ceramic coffee cup on a light marble surface, soft studio lighting, top view, commercial photography style",
  "size": "1536x1024",
  "quality": "high",
  "n": 1,
  "background": "opaque",
  "output_format": "webp",
  "output_compression": 82,
  "response_format": "b64_json"
}

А вот вариант для быстрого прототипирования:

{
  "model": "gpt-image-1",
  "prompt": "...",
  "size": "1024x1024",
  "quality": "low",
  "n": 4,
  "response_format": "url"
}

Типичные ошибки при настройке параметров

Transparent + jpeg. JPEG не поддерживает альфа-канал. Прозрачный фон просто не сработает — используй png или webp.
High quality на каждой итерации. Разработка промпта на максимальном качестве — это медленно и дорого. Итерируй на low/medium.
n=10 без чёткого промпта. Много вариантов одного плохого промпта = много плохих результатов. Сначала отточи промпт на n=1.
Забытый output_compression. По умолчанию для jpeg/webp может применяться высокое сжатие. Явно укажи нужное значение.
URL-формат в продакшне. Временные ссылки протухают. Если не сохранишь файл сразу — потеряешь результат.

Больше частых проблем и их решений — в статье Ошибки GPT Image 2.0: 7 типичных проблем и как их исправить.

Попробуй все параметры на Neyrix

Все описанные параметры доступны без написания кода — прямо в интерфейсе GPT Image 2.0 на Neyrix. Переключай качество, меняй размер, генерируй несколько вариантов сразу — и сразу видишь результат. Идеально для тех, кто хочет разобраться в параметрах на практике без лишних настроек окружения.

#GPT Image 2.0#параметры генерации#генерация изображений#OpenAI#API#настройки модели#инструкция

Частые вопросы

GPT Image 2.0 поддерживает три размера: 1024×1024 (квадрат), 1536×1024 (горизонталь) и 1024×1536 (вертикаль), а также режим auto, когда модель выбирает размер сама.

При quality=high модель генерирует более детализированное изображение, точнее следует промпту и лучше прорабатывает текстуры, но это занимает больше времени и стоит дороже. Quality=low — быстрый черновик для проверки идей.

Установи параметр background=transparent и output_format=png или webp. JPEG не поддерживает прозрачность, поэтому с ним этот параметр не работает.

Параметр n определяет количество изображений, которые модель сгенерирует за один запрос. Принимает значения от 1 до 10. Все варианты создаются по одному промпту, но с разными результатами.

url удобен для быстрого просмотра и фронтенда, но ссылки временные и протухают примерно через час. b64_json возвращает изображение прямо в ответе — лучший выбор для бэкенд-приложений и пайплайнов.

Через эндпоинт /images/edits передаётся исходное изображение, маска (PNG с прозрачными областями для перерисовки) и промпт с описанием нужного изменения. Модель перерисовывает только замаскированную зону.

Параметры GPT Image 2.0: полный разбор настроек генерации изображений