Почему промпт для Wan 2.7 — это мини-сценарий
Большинство новичков пишут промпты вроде «эпичное кинематографичное видео с крутой атмосферой» — и потом удивляются, почему модель генерирует хаос. Дело в том, что Wan 2.7 Video воспринимает текст буквально: если не задать чёткую структуру, модель начинает импровизировать. Иногда весело, чаще — бесполезно.
Хороший промпт для Wan 2.7 устроен как режиссёрская пометка: что в кадре, как двигается камера, какой звук, какое освещение. Именно конкретные глаголы и технические описания управляют движением — а не прилагательные вроде «красивый» или «мрачный».
Анатомия промпта: из каких блоков он состоит
Промпт для Wan 2.7 лучше всего разбить на отдельные смысловые блоки. Каждый блок отвечает за свой аспект генерации и не мешает остальным.
Цель и тон: короткая фраза, которая задаёт общее настроение («cinematic thriller short, single-shot, tense atmosphere»)
Сцена / локация: время суток, погода, ключевые объекты в кадре
Тип кадра: wide shot / medium shot / close-up / POV — без этого модель выбирает сама, и обычно невпопад
Действие: конкретные глаголы с описанием микродвижений («пальцы сжимают ремень», «взгляд уходит влево»)
Камера: статика, плавный push-in, handheld-дрожь
Свет: источник и характер света (neon bounce, golden hour rim, overhead fluorescent)
Звук: амбиент, фоли, музыкальный характер, диалог
Каждый блок — отдельная строка или пункт. Не валите всё в один абзац: модель читает текст сверху вниз, и первые фразы перебивают последние.
Базовый шаблон промпта (копируй и адаптируй)
Goal: [cinematic short / product ad / documentary clip]
Tone: [warm / tense / comedic / calm]
Scene 1 — [Wide shot]
[Локация, время суток, ключевые объекты]
Sound: [амбиент: дождь, кафе, тишина]
Scene 2 — [Close-up]
[Деталь лица или предмета. Микродвижение.]
Dialogue: "[Фраза на нужном языке]"
Scene 3 — [Medium shot]
[Реакция или смена позиции, которая завершает арк]
Sound: [foley или музыкальный свелл]
Camera: [slow push-in / static tripod / handheld micro-shake]
Lighting: [practicals / neon bounce / golden hour]
Finish on: [эмоция или пуанта, которую должен запомнить зритель]Шаблон работает как для text-to-video (когда у тебя только идея), так и для image-to-video (когда есть опорный кадр, который нужно анимировать). Во втором случае блоки сцены описывают движение поверх уже заданной картинки.
5 разобранных примеров промптов
Пример 1 — Городская зарисовка (эмоциональная)
Goal: cinematic emotional short, two-shot sequence
Tone: melancholic, warm
Scene 1 — Wide shot
Rainy Tokyo street at night, neon reflections on wet asphalt,
woman in yellow raincoat stands at crosswalk, looking up.
Sound: rain ambience, distant traffic, faint piano
Scene 2 — Close-up
Her face, drops on eyelashes, slight smile forming.
Dialogue: "やっと来たね" (Japanese, soft, warm)
Camera: slow push-in from wide to medium
Lighting: neon bounce from left, soft rim from above
Finish on: relieved expression, breath releaseПочему работает: чёткий переход от широкого плана к крупному создаёт эмоциональную дугу. Конкретная деталь («капли на ресницах») даёт модели понятную визуальную цель. Диалог короткий — это важно для синхронизации губ.
Пример 2 — Рекламный продуктовый ролик
Goal: premium product commercial, 8 seconds
Tone: sleek, confident
Scene 1 — Extreme close-up
Black ceramic coffee cup on white marble surface,
steam rises slowly, golden morning light from right.
Sound: subtle ambient hum, no dialogue
Scene 2 — Medium shot
Hand with manicured nails picks up cup, lifts toward camera.
Camera: static, slight tilt upward to follow motion
Lighting: golden hour side-light, soft shadow
Finish on: cup filling frame, steam dissipatingПочему работает: в рекламных роликах не нужен нарратив — нужна фактура. «Чёрная керамика», «белый мрамор», «маникюрные ногти» — конкретные материалы, которые модель может воспроизвести. Отсутствие диалога убирает риск плохой синхронизации.
Пример 3 — Экшн-сцена
Goal: action sequence, single continuous shot
Tone: tense, kinetic
Scene — Low-angle medium shot
Young man in grey hoodie sprints down narrow alley,
bricks on both sides, puddles splash under sneakers.
He glances back over right shoulder, jaw tight.
Camera: handheld micro-shake, tracking from behind
Lighting: overcast diffuse, one flickering streetlamp ahead
Sound: footsteps echo, distant siren, heavy breathing
Finish on: figure disappears around corner into darknessПочему работает: «jaw tight» и «glances back over right shoulder» — это конкретные телесные действия, а не «он испуган». Handheld-камера указывает модели на нужную энергетику без лишних слов. Финальный кадр («уходит за угол во тьму») закрывает сцену чисто.
Пример 4 — Образовательный/документальный клип
Goal: documentary-style explainer clip, calm educational tone
Language: Russian (clear enunciation, neutral Moscow accent)
Scene 1 — Medium shot
Young woman in lab coat stands at whiteboard,
points at diagram with marker, slight nod.
Dialogue: "Квантовые вычисления работают иначе, чем классические."
Scene 2 — Insert close-up
Whiteboard diagram: simple qubit symbol, annotated in Russian.
Sound: room ambience, marker squeak, silence after line
Camera: static, slight rack focus from face to board
Lighting: soft overhead fluorescent, no harsh shadows
Finish on: whiteboard filling frameПочему работает: для образовательного контента важна чёткость речи — поэтому явно указан язык и акцент. Короткая фраза в диалоге помогает модели синхронизировать артикуляцию. Insert-кадр с доской разбивает монотонность.
Пример 5 — Комедийный вертикальный рилс
Goal: comedic vertical short for social media (9:16)
Tone: absurdist, fast-paced
Scene 1 — Medium shot
Office worker in suit stares at blank monitor,
coffee cup trembles in hand.
Sound: tense orchestral sting
Scene 2 — Extreme close-up
Screen flickers: error message fills display.
Sound: Windows XP error sound (implied)
Scene 3 — Wide shot, same desk
Worker calmly stands up, puts on sunglasses,
walks out without looking back.
Camera: static, deadpan
Sound: upbeat lo-fi beat kicks in
Finish on: empty chair, spinning loading cursor on screenПочему работает: структура «нагнетание — удар — deadpan-выход» — классика интернет-юмора. Три короткие сцены укладываются в 5–7 секунд. «Deadpan camera» — конкретная инструкция для оператора-модели.
Типичные ошибки и как их избежать
Один огромный абзац. Модель читает сверху вниз — ранние описания перекрывают поздние. Разбивай на сцены и строки.
Прилагательные вместо глаголов. «Грустный» не даёт движения. «Плечи опускаются, взгляд уходит в сторону» — даёт.
Слишком много сцен на короткий хронометраж. 4 сцены за 5 секунд = смазанные переходы. Либо меньше сцен, либо больше длительность.
Длинный диалог. Длинные реплики плохо синхронизируются с губами. Держи фразы до 7–8 слов.
Забытый тип кадра. Без указания «wide/medium/close-up» модель выбирает случайно. Это первое, что нужно добавить.
Смешанные языки в диалоге. Если нужен двуязычный ролик — делай отдельный блок диалога для каждого языка, не мешай их в одну реплику.
Настройки: длина, соотношение сторон, аудио
Промпт — это только половина работы. Вторая половина — правильные параметры генерации.
5 секунд — одна идея, один визуальный крючок. Для гэга или продуктового инсерта.
8–10 секунд — полноценная мини-дуга: завязка, поворот, финал.
9:16 — вертикальный формат для Reels и Shorts. Сосредоточься на лицах и крупных планах.
16:9 — горизонталь для презентаций и YouTube. Двухплановые сцены и среда читаются лучше.
Аудио включено — убедись, что в промпте есть звуковые инструкции, иначе трек будет случайным.
Аудио выключено — удали все реплики из промпта, чтобы не получить беззвучное движение губ.
Попробовать все эти настройки вживую можно на Neyrix — там доступны как Wan 2.7 Video, так и другие топовые видеомодели для сравнения.
Быстрый чеклист перед генерацией
Указан тип кадра для каждой сцены? (wide / medium / close-up)
Действия описаны глаголами, а не прилагательными?
Длительность соответствует числу сцен?
Диалог короткий (до 8 слов) и на одном языке?
Указана позиция и характер камеры?
Звук прописан рядом с нужной сценой?
Есть финальная эмоция или пуанта?
Если все семь пунктов отмечены — жми «Генерировать». Если нет — промпт можно улучшить за 2 минуты, и результат будет в разы стабильнее.

