Параметры NanoBanana 2: разбор режимов и настроек API

NanoBanana 2 — это модель генерации изображений от Google, которая работает на скорости Gemini Flash и при этом обладает мощью Nano Banana Pro: точным рендером текста, знанием реального мира и согласованностью персонажей на нескольких референсах. В этой статье разберём каждый режим и параметр модели: что делает, на что влияет и когда использовать.

Архитектура запроса: как устроен вызов NanoBanana 2

Все запросы к модели строятся по одной схеме — через Interactions API. Базовый вызов выглядит так:

interaction = client.interactions.create(
    model="gemini-3.1-flash-image-preview",
    input=...,       # текст или список блоков
    tools=[...]      # опционально: инструменты поиска
)

Есть три ключевых параметра, которые определяют поведение модели:

model — идентификатор модели (gemini-3.1-flash-image-preview)
input — входные данные: строка или список блоков (текст + изображения)
tools — список инструментов, расширяющих возможности генерации

Режим 1: Text to Image — базовая генерация по тексту

Самый простой режим: передаёшь текстовый промпт, получаешь изображение. NanoBanana 2 самостоятельно обрабатывает фотореализм, рендер надписей и сложные композиции — без каких-либо дополнительных инструментов.

Когда использовать: концепт-арт, постеры, иллюстрации, когда не важна фактическая точность конкретных реальных объектов.

interaction = client.interactions.create(
    model="gemini-3.1-flash-image-preview",
    input="""A cinematic travel poster for Kyoto, Japan in autumn.
    Cherry-red maple leaves frame a traditional wooden torii gate
    at golden hour. The text 'KYOTO' is rendered in elegant serif
    typography at the bottom. Photorealistic, warm tones, 35mm film look."""
)

Кинематографический постер Киото, сгенерированный NanoBanana 2 в режиме Text to Image

Обрати внимание: модель корректно отрисовала текст «KYOTO», выдержала золотой час и атмосферу 35mm плёнки — всё из одного промпта без дополнительных настроек.

Режим 2: Text to Image + Web Search — генерация с фактической точностью

Добавляя инструмент google_search с типом web_search, ты включаешь поиск в интернете перед генерацией. Модель сначала ищет актуальную текстовую информацию, а затем использует её как контекст.

Когда использовать: когда нужно, чтобы модель знала реальные факты — правильные названия мест, актуальные данные, точные имена объектов.

tools=[
    {
        "type": "google_search",
        "search_types": ["web_search"]
    }
]

Иллюстрированная туристическая карта Киото, созданная с помощью Web Search в NanoBanana 2

В примере выше модель самостоятельно нашла топ-5 достопримечательностей Киото и корректно подписала их на карте в стиле старинной картографии. Важный нюанс: при web-поиске модель знает, что изображает, но всё равно воображает, как это выглядит. Для визуальной точности нужен следующий режим.

Режим 3: Text to Image + Web + Image Search — визуально точная генерация

Ключевое нововведение NanoBanana 2 — параметр image_search в массиве search_types. Модель не просто читает о месте — она реально скачивает фотографии из Google Images и использует их как визуальные референсы во время генерации.

Параметр `search_types`	Что делает модель	Результат
`["web_search"]`	Читает текстовые описания объектов	Фактически верно, визуально приблизительно
`["image_search"]`	Скачивает реальные фото из Google Images	Визуально точно, без текстового контекста
`["web_search", "image_search"]`	Читает описания + видит фотографии	Максимальная точность: факты + внешний вид

tools=[
    {
        "type": "google_search",
        "search_types": ["web_search", "image_search"]
    }
]

Постер святилища Фусими Инари с точными оранжевыми воротами тории, сгенерированный NanoBanana 2 с Image Search

Разница очевидна: модель точно воспроизвела характерный оранжевый цвет и форму ворот тории в Фусими Инари — потому что видела реальные фотографии, а не только читала описание.

Совет: image_search можно использовать и отдельно, без web_search — если тебе важна только визуальная точность, а текстовый контекст не нужен:

tools=[{"type": "google_search", "search_types": ["image_search"]}]

Режим 4: Text + Image Input — вставка реального человека в сцену

Самый мощный режим: параметр input принимает не строку, а список блоков разных типов. Ты передаёшь одновременно текст и изображение (фото человека), а модель интегрирует внешность этого человека в сгенерированную сцену.

Когда использовать: персонализированные открытки, туристические брошюры, маркетинговые материалы с конкретным человеком, прототипирование аватаров.

input=[
    {
        "type": "text",
        "text": "Search for what the Arashiyama bamboo grove looks like.
        Then generate a photo of this person standing in it..."
    },
    {
        "type": "image",
        "data": image_data,   # base64-кодированное изображение
        "mime_type": "image/png"
    }
]

Один API-вызов объединяет сразу три возможности модели: сохранение внешности человека из референса, поиск реальных фотографий локации, фотореалистичная композиция с кинематографическим освещением.

Примеры генерации: что умеет модель

Природные сцены

NanoBanana 2 отлично справляется с атмосферными пейзажами — мягкий свет, туман над водой, глубина пространства:

Спокойная сцена озера на рассвете с туманом и горами, сгенерированная NanoBanana 2

Prompt: «Generate a vivid and immersive scene of a peaceful lakeside at sunrise. Soft golden light reflecting on the water, gentle mist rising from the lake, and distant mountains partially covered in fog. Calm, cinematic, emotionally soothing.»

Городские ночные сцены

Неоновое освещение, отражения в лужах, динамика мегаполиса — модель держит сложную световую картину без потери деталей:

Кинематографическая ночная городская сцена с неоновыми огнями и мокрыми улицами, сгенерированная NanoBanana 2

Prompt: «A cinematic nighttime city scene with neon lights reflecting on wet streets after rain. Tall buildings, glowing signboards, light traffic. Vibrant, modern, slightly moody atmosphere.»

Редактирование изображений

Передаёшь исходное фото и описываешь трансформацию — модель переносит главный объект в новое окружение, сохраняя его внешний вид:

Исходное изображение рыбки в аквариуме для редактирования через NanoBanana 2

Рыбка перенесена в подводную океанскую сцену с кораллами — результат редактирования в NanoBanana 2

Prompt: «Transform the scene into a cinematic ocean environment. Replace the fishbowl with a vast underwater scene with coral reefs and soft light rays. Preserve the fish's position and motion.»

Ключевые параметры: сводная таблица

Параметр	Тип	Что делает	Когда использовать
`model`	string	Выбор модели	Всегда `gemini-3.1-flash-image-preview`
`input` (строка)	string	Текстовый промпт	Базовая генерация без референсов
`input` (список)	array	Текст + изображения	Когда нужны референсные фото людей или объектов
`tools[].type`	string	Тип инструмента	`google_search` для поиска
`search_types: ["web_search"]`	array	Текстовый поиск в интернете	Фактическая точность: имена, факты, описания
`search_types: ["image_search"]`	array	Поиск реальных фото	Визуальная точность: как выглядит объект
Оба `search_types`	array	Полное заземление	Максимальная точность: факты + внешний вид

Лучшие практики и типичные ошибки

Структурируй промпт по слоям: субъект → окружение → стиль → свет → композиция. Это значительно улучшает результат по сравнению с одним предложением.
Указывай стиль явно: «photorealistic», «35mm film look», «cinematic lighting» — модель понимает и точно воспроизводит профессиональные термины.
Не включай image_search без необходимости: для абстрактных или выдуманных сцен image search только мешает — добавляй его только для реальных мест и объектов.
Передавай качественные референсы: чем чище и чётче исходное фото человека, тем точнее модель сохранит его внешность в результате.
Комбинируй web_search + image_search для реальных локаций: это даёт и фактическую, и визуальную точность одновременно.
Тестируй итеративно: начни с базового режима, затем добавляй инструменты по одному — так проще понять, что именно улучшает результат.

Всё описанное выше доступно прямо сейчас на Neyrix — без установки SDK и настройки окружения. Загружай референс, пиши промпт, выбирай режим — и смотри результат мгновенно.

Связанные материалы

Если хочешь углубиться в работу с NanoBanana 2 — читай дальше:

#NanoBanana 2#параметры генерации#Gemini API#image generation#Google AI#image search#API разбор

Частые вопросы

Параметр search_types управляет тем, какой тип поиска использует модель перед генерацией. Значение web_search добавляет текстовую информацию из интернета, image_search — реальные фотографии из Google Images. Их можно комбинировать для максимальной точности.

Вместо строки в параметр input передаётся список блоков: один блок типа text с промптом и один блок типа image с base64-кодированным изображением. Модель сохраняет внешность человека в финальной генерации.

web_search даёт модели текстовые факты (названия, описания, характеристики), но модель всё равно воображает визуальный облик объекта. image_search позволяет модели увидеть реальные фотографии и воспроизвести точный внешний вид.

Нет. Для абстрактных, художественных или выдуманных сцен инструменты поиска не нужны — базового режима Text to Image вполне достаточно. Поиск стоит добавлять только когда важна точность реальных мест, объектов или людей.

NanoBanana 2 поддерживает до 14 референсных изображений в одном запросе, сохраняя согласованность персонажей и объектов между ними.

Оптимальная структура: субъект → окружение/сеттинг → художественный стиль → освещение → атмосфера → композиция. Явное указание стиля (photorealistic, cinematic, 35mm film) значительно улучшает результат.

Параметры NanoBanana 2: полный разбор режимов и настроек генерации