Новый генератор видео Veo 2 от Google превосходит своего конкурента Sora от OpenAI
Подразделение Google DeepMind представила Veo 2, новую версию своей ИИ-модели для создания видео, которая может составить конкуренцию недавно выпущенной Sora от OpenAI.
Veo 2 способна генерировать ролики с разрешением до 4K (4096×2160 пикселей) и продолжительностью более двух минут. Это в четыре раза выше разрешение и в шесть раз больше продолжительность, чем может достичь Sora. Veo 2 сейчас доступна в экспериментальном режиме через инструмент Google VideoFX с ограничениями в 720p и 8 секунд. Однако Google планирует расширить доступ по мере готовности модели к масштабированию.
Разработчики отмечают, что новая версия Veo генерирует более четкие текстуры, особенно в динамичных сценах, а также лучше понимает физику и управление виртуальной камерой. Veo 2 способна более точно позиционировать камеру и перемещать её для съемки объектов и людей с разных ракурсов. Кроме того, модель более реалистично моделирует движение, динамику жидкостей, свойства света, включая тени и отражения, а также различные линзы и кинематографические эффекты.
Veo 2 все еще имеет некоторые ограничения. DeepMind утверждает, что модель менее склонна к «галлюцинациям», таким как лишние пальцы, но она все еще не может полностью избежать «зловещей долины», что проявляется в неестественном виде глаз и нереалистичном движении некоторых объектов. Также модель может последовательно придерживаться подсказки в течение нескольких минут, но испытывает трудности с выполнением сложных подсказок на больших временных отрезках.
Представители компании заявили, что 59% тестировщиков предпочитают Veo 2 по сравнению с Sora Turbo, в то время как Sora Turbo предпочли лишь 27%. Veo 2 также показала превосходство над Minimax и Movie Gen от Meta, но незначительно уступила Kling v1.5. Google DeepMind также анонсировало обновление Imagen 3, модели для генерации изображений. Обновленная модель доступна в инструменте ImageFX, где пользователи могут создавать изображения в различных стилях.
Читать на dev.by