Как пользоваться: Генерация видео · Grok Imagine
Готовый ролик со звуком за 17 секунд
Опишите сцену — на выходе получаете видео 720p с синхронной озвучкой. Реплики персонажей попадают в губы, окружение и эффекты создаются в той же генерации. Не нужны ElevenLabs, не нужны бесплатные SFX-библиотеки. Один промпт — готовый клип.
До 10 секунд, рендер ≈ 17 секунд — в 2–4 раза быстрее Veo и Sora в этом сегменте.
Когда брать именно этот режим
TikTok / Reels / Shorts. Сцена с движением и звуком — в один клик.
Рекламные тизеры. Товар, эмоция, реакция за 5–10 секунд.
Сценки с диалогом. Речь с попаданием в губы — из коробки.
Атмосферные клипы. Закаты, города, природа, спецэффекты.
Формула: сцена + камера + звук
В отличие от картинки, в видео важно явно сказать что движется и как звучит. Три обязательных пункта:
Сцена — кто, где, в каком настроении
Камера — slow zoom in, orbit shot, handheld, tracking
Звук — реплики, шум окружения, музыка
Кинематографичный кадр с репликой
Slow zoom in on a young woman standing on a rainy Tokyo rooftop
at night, neon reflections on her face. She turns slowly and
whispers "I knew you'd come back." Distant thunder and city
ambience. Cinematic, anamorphic lens.Рекламный тизер автомобиля
360° orbit around a glossy black sports car on a wet asphalt
under purple neon lights, droplets falling in slow motion. Deep
synthwave bass and tire squeak. Cinematic teaser, 16:9.Персонаж говорит с зрителем
Close-up of a bearded chef in a wood-fired pizzeria, smiling
warmly at the camera. He says "Best margherita in Naples — come
taste it." Sound of crackling fire and Italian conversation in
background.Атмосферный городской клип
Slow tracking shot through a neon-lit Hong Kong alley at night,
steam rising from food stalls, motorbike speeding past. Lo-fi
hip-hop beat, distant rain. Cinematic, 9:16 vertical.Финт с лип-синком: пометьте конкретные фразы в кавычках, опишите эмоцию говорящего. Grok автоматически синхронизирует реплику в губы — отдельный voice-over не нужен.
Лайфхак: пробуйте идею сначала в text-to-image
Возьмите свой видео-промпт без описания движения и звука, запустите как картинку. Получите статичный кадр за пару секунд. Если попало — переносите концепцию в видео. Это экономит 90% времени на поиске нужного вайба.
Чек-лист
Сцена и герой описаны конкретно
Указано движение камеры
Звук — реплики, окружение, музыка
Реплики персонажей в кавычках