Все модели
Видео· google

🎥Veo 3.1 (Quality)

Google Veo 3.1: фотореализм и нативный lip-sync

Описание

Veo 3.1 (Quality)

Google Veo 3.1 — флагман DeepMind по видео: кинематографический свет, нативная синхронная озвучка, реалистичная физика. Тот случай, когда из 8 секунд получается готовый кадр для рекламы.

ТипВидео (text-to-video, image-to-video)
Автор моделиGoogle DeepMind (Veo 3.1)
Длительность8 секунд
Цена250 / 255 / 380 токенов (720p / 1080p / 4K)
Пропорции16:9, 9:16, Auto
РеференсыДо 3 изображений
ЗвукНативный синхронный (диалоги, окружение, SFX)


Для чего она

Veo 3.1 Quality — это «премиум» вариант Veo для случаев, когда видео идёт в эфир, в рекламу или в портфолио. У неё четыре сильные стороны, из-за которых её выбирают:

  • Фотореализм уровня кино. Текстуры, свет, отражения, глубина поля — на уровне продакшен-съёмки. Лица людей, шерсть животных, материалы — без артефактов «генерации».
  • Нативный синхронный звук. Диалоги с lip-sync, окружающий амбиент, SFX — генерируются вместе с картинкой за один проход. Не нужно собирать звук отдельно.
  • Физика и поведение объектов. Жидкости льются, ткань падает, тени двигаются за источником света — правдоподобно.
  • Понимание сложных сцен. Несколько персонажей, многоплановые действия, движение камеры — всё удерживается в одной сцене.

Когда брать Quality:

  • Реклама, презентации, премиум-контент.
  • Кадры с реальными людьми, продуктами, лицами — где артефакты убьют доверие.
  • Сцены с диалогом и lip-sync.
  • 1080p для веба, 4K для проката и крупных экранов.

Когда брать что-то другое:

  • Нужно много и дёшево, можно жертвовать качеством → Veo 3.1 Fast (на 720p в ~4 раза дешевле, на 4K — в ~2 раза).
  • Совсем массовый поток, превью, A/B-тесты промптов → Veo 3.1 Lite (на 720p в ~8 раз дешевле).
  • Нужны кадры до 15 секунд с мульти-кадровыми сценами → Kling 3.0.
  • Видео-правка существующего ролика → Runway Aleph.

Что задаёте при запуске

  • Промпт — описание сцены. Удерживает развёрнутый бриф со светом, движением камеры, эмоцией персонажа, окружением.
  • Соотношение сторон16:9 (по умолчанию), 9:16 (вертикаль для соцсетей), Auto.
  • Разрешение720p, 1080p или 4k. По умолчанию 720p.
  • Референсы — до 3 изображений. С референсом получается image-to-video (оживление картинки) или reference-to-video (модель опирается на стиль/персонажа).
  • Авто-перевод промпта — флаг. По умолчанию включён: русский промпт автоматически переводится на английский для модели.

Цена и разрешения

РазрешениеЦена за 8-секундный ролик
720p250 токенов
1080p255 токенов
4K380 токенов

Разница между 720p и 1080p — 5 токенов: считайте 1080p «по умолчанию для веба», 720p — для черновиков. 4K — для проката и крупных дисплеев.


Советы по промптингу

  • Опишите движение камеры. «Плавный наезд», «съёмка с дрона», «фиксированная съёмка», «доли» — Veo 3.1 это понимает.
  • Опишите свет. «Золотой час», «контровой свет», «студийная лайт-сетка», «вечерний город» — даёт стабильный визуальный результат.
  • Звук пишите отдельно. «Девушка говорит: "Доброе утро"», «звук капающего кофе на фоне», «лёгкий дождь за окном». Lip-sync работает лучше всего, когда диалог короткий и в кавычках.
  • Для image-to-video — описывайте, что должно происходить, а не как выглядит сцена (это и так на референсе). «Камера медленно наезжает, девушка поворачивает голову вправо».
  • Для рекламы продукта — добавьте действие. Статичные кадры с предметом скучные; «бутылка вращается, отражение скользит по стеклу» — выглядит профессионально.

Ограничения

  • 8 секунд — потолок длительности на один запрос. Длиннее — через отдельную ручку extension (нативно мы её пока не показываем).
  • Звук помечен Google как experimental: иногда может не сгенерироваться. Считайте бонусом, а не гарантией.
  • 4K не получится продлить — extension работает только на результатах до 1080p.
  • Sensitive-контент (реальные лица в неэтичных сценах, политические темы, насилие) — отсекается модерацией.

FAQ

Чем Quality отличается от Fast и Lite?

Quality — та же модель Veo 3.1, но с самыми высокими настройками качества и временем рендера. Fast — облегчённый режим (примерно в 4 раза дешевле, чуть менее точные детали). Lite — самый дешёвый (в 8 раз дешевле Quality, без режима Reference-to-Video и некоторых продвинутых фич).

Можно ли получить ролик длиннее 8 секунд?

Базовая длительность — 8 с. Продлить ролик можно через отдельную функцию extension (на текущей версии каталога её ещё нет в UI). 4K ролики продлению не подлежат.

Что со звуком?

Veo 3.1 умеет нативный синхронный звук: диалоги с lip-sync, амбиент, SFX. По заметке Google это experimental — на части роликов может отсутствовать.

Поддерживается ли image-to-video?

Да. Положите 1–3 референса. Если кладёте 1 — это i2v (оживление кадра). Несколько — reference-to-video.

Можно ли коммерчески использовать?

Да.

Примеры

19 мая, 00:18

Попробуйте Veo 3.1 (Quality) прямо сейчас

Параметры готовы, осталось задать промпт и нажать «Сгенерировать».

Открыть в редакторе