Николай Чикишев 17 снежня 2024, 12:10

Новы генератар відэа Veo 2 ад Google пераўзыходзіць свайго канкурэнта Sora ад OpenAI

Падраздзяленне Google DeepMind паказала Veo 2, новую версію сваёй АІ-мадэлі для стварэння відэа, якая можа скласці канкурэнцыю нядаўна выпушчанай Sora ад OpenAI.

Пакінуць каментарый

Новы генератар відэа Veo 2 ад Google пераўзыходзіць свайго канкурэнта Sora ад OpenAI

Падраздзяленне Google DeepMind паказала Veo 2, новую версію сваёй АІ-мадэлі для стварэння відэа, якая можа скласці канкурэнцыю нядаўна выпушчанай Sora ад OpenAI.

Veo 2 здольная генераваць ролікі з разрознасцю да 4К (4096×2160 пікселяў) і працягласцю большай за дзве хвіліны. Гэта ў чатыры разы вышэйшая разрознасць і ў шэсць разоў большая працягласць, чым можа дасягнуць Sora. Veo 2 цяпер даступная ў эксперыментальным рэжыме праз інструмент Google VideoFX з абмежаваннямі ў 720p і 8 секунд. Аднак Google плануе пашырыць доступ па меры гатоўнасці мадэлі да маштабавання.

Google Veo 2

Распрацоўшчыкі адзначаюць, што новая версія Veo генеруе выразнейшыя тэкстуры, асабліва ў дынамічных сцэнах, а таксама лепш разумее фізіку і кіраванне віртуальнай камерай. Veo 2 здольная дакладней пазіцыянаваць камеру і перамяшчаць яе для здымкі аб’ектаў і людзей з розных ракурсаў. Акрамя таго, мадэль рэалістычней мадэлюе рух, дынаміку вадкасцяў, уласцівасці святла, уключаючы цені і адбіткі, а таксама розныя лінзы і кінематаграфічныя эфекты.

Veo 2 усё яшчэ мае некаторыя абмежаванні. DeepMind сцвярджае, што мадэль менш схільная да «галюцынацый», такіх як лішнія пальцы, але яна ўсё яшчэ не можа цалкам пазбегнуць «жудаснай даліны», што выяўляецца ў ненатуральным выглядзе вачэй і нерэалістычным руху некаторых аб’ектаў. Таксама мадэль можа паслядоўна прытрымлівацца падказкі на працягу некалькіх хвілін, але адчувае цяжкасці з выкананнем складаных падказак на вялікіх часавых адрэзках.

Google Veo 2

Прадстаўнікі кампаніі заявілі, што 59% тэсціроўшчыкаў аддаюць перавагу Veo 2 у параўнанні з Sora Turbo, а Sora Turbo аддалі перавагу толькі 27%. Veo 2 таксама паказала перавагу над Minimax і Movie Gen ад Meta, але нязначна саступіла Kling v1.5. Google DeepMind таксама анансавала абнаўленне Imagen 3, мадэлі для генерацыі выяў. Абноўленая мадэль даступная ў інструменце ImageFX, дзе карыстальнікі могуць ствараць выявы ў розных стылях.