Новая нейрасетка Microsoft стварае страшэнна рэалістычныя відэа па адной фатаграфіі

Microsoft паказала сістэму VASA-1, якая генеруе рэалістычныя твары, што размаўляюць, усяго па адной фатаграфіі і аўдыязапісе.

Пакінуць каментарый

VASA-1 выразна сінхранізуе рух вуснаў з гукавым фрагментам — прычым гэта могуць быць песні або маўленне не на англійскай мове, хоць мадэль на іх не вучылася, — і стварае рухі галавы, якія натуральна выглядаюць. Таксама нейрасетка перадае шырокі спектр эмоцый і тонкія нюансы мімікі, дзякуючы чаму ролікі выглядаюць яшчэ натуральнейшымі. Карыстальнік можа сам пазначыць, напрыклад, куды мае быць накіраваны позірк чалавека на відэа і ягоны настрой.

Распрацоўшчыкі падкрэсліваюць эфектыўнасць працы нейрасеткі ў рэжыме рэальнага часу. Яна здольная генераваць відэа з разрознасцю 512*512 пікселяў з частатой да 45 кадраў на секунду.

Падрабязней пра новую сістэму з прыкладамі кампанія расказала ў сваім блогу.

Люди не могут отличить видео, сгенерированные OpenAI Sora, от настоящих
По теме
Люди не могут отличить видео, сгенерированные OpenAI Sora, от настоящих

Читать на dev.by