Николай Чикишев 26 студзеня 2024, 14:20

Google паказала генератар відэа паводле тэкставага апісання Lumiere

Кампанія паказала АІ-генератар відэа Lumiere, які стварае дынамічныя выявы паводле тэкставага апісання. Распрацоўшчыкі называюць інструмент самым магутным сярод вядомых аналагаў.

2 каментарыя

Google паказала генератар відэа паводле тэкставага апісання Lumiere

Кампанія паказала АІ-генератар відэа Lumiere, які стварае дынамічныя выявы паводле тэкставага апісання. Распрацоўшчыкі называюць інструмент самым магутным сярод вядомых аналагаў.

Стваральнікі называюць сэрвіс «мадэллю прасторава-часавай дыфузіі для рэалістычнай генерацыі відэа», заснаванай на штучным інтэлекце. Адрозненнем Lumiere ад аналагаў стала ўнікальная архітэктура мадэлі: відэа на ўсёй яго працягласці генеруецца за адзін праход. Іншыя мадэлі генеруюць некалькі ключавых кадраў, а затым робяць інтэрпаляцыю па часе.

Генератар Google працуе ў некалькіх рэжымах. Сэрвіс можа пераўтвараць тэкст у відэа, канвертаваць статычныя выявы ў дынамічныя, ствараць ролікі ў зададзеным стылі на аснове ўзору, рэдагаваць існае відэа паводле пісьмовых падказак, аніміраваць пэўныя вобласці статычнай выявы або рэдагаваць відэа фрагментарна.

У кампаніі растлумачылі, што мадэль навучалі на наборы даных, які ўключае 30 мільёнаў ролікаў з тэкставымі апісаннямі. Відэа маюць даўжыню 80 кадраў з частатой 16 кадраў на секунду. Базавая мадэль навучаная на разрознасці 128×128 пікселяў. Lumiere генеруе пяцісекундныя ролікі з разрознасцю 1024×1024 пікселяў.

Раней Google паказала мадэль Imagen Video, якая генеруе ролікі разрознасцю 1280×768 пікселяў з частатой кадра 24 кадры на секунду. Аднак мінусам была меншая рэалістычнасць, што назіраецца і ў аналагічных генератарах, такіх як Make-A-Vide ад Meta, Runway Gen2 і Stable Video Diffusion.

Google адзначыла, што разумее пагрозу, якую могуць з’яўляць падобныя праекты. «Асноўная нашая мэта ў гэтай працы — даць карыстальнікам-пачаткоўцам магчымасць генераваць візуальны кантэнт гнутка і творча. Аднак існуе рызыка неправамернага [стварэння] падробак або шкоднага кантэнту пры дапамозе нашай тэхналогіі, і мы лічым, што вельмі важна распрацоўваць і прымяняць інструменты выяўлення выпадкаў прадузятасці і зламыснага выкарыстання, каб забяспечыць бяспечную і добрасумленную працу [мадэлі]», — заявілі ў кампаніі.

Google абвінаваціў расійскія спецслужбы ў арганізацыі кібератак

Ученые выяснили почему качество поиска Google сильно ухудшилось

Google представила функцию поиска всего что есть на экране смартфона

2 каментарыя

Тэкст: Николай Чикишев

Знайшлі памылку ў тэксце-вылучыце яе і націсніце Ctrl+Enter. Знайшлі памылку ў тэксце-вылучыце яе і націсніце кнопку «Паведаміць пра памылку».

Сайт компании Вакансии

Размяшчэнне рэкламы

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Zhan Chubukou Шчолкаю зубамі в ЗАО "Прыдацелі і атшчыпенцы"

0

Ух ты! С учетом наличия собственного здоровенного облака научились делать много картинок на основе stable diffusion? Ну да, это прорыв в стиле Пакистана. Нет мозгов, зато железа много - давай запустим генерацию картинок быстрее, а потом сложим так, чтобы видосик получался ) И где-то на том конце друг Сарвар хлопает в ладошки - отличный план!

Карыстальнік адрэдагаваў каментарый 29 студзеня 2024, 02:44

testtest11111

Каментарый скрыты за парушэнне правілаў каментавання.

Правила тут, их всего 5

Увайдзіце, каб пакінуць каментарый