Новая нейрасетка Microsoft стварае страшэнна рэалістычныя відэа па адной фатаграфіі
Microsoft паказала сістэму VASA-1, якая генеруе рэалістычныя твары, што размаўляюць, усяго па адной фатаграфіі і аўдыязапісе.
Microsoft паказала сістэму VASA-1, якая генеруе рэалістычныя твары, што размаўляюць, усяго па адной фатаграфіі і аўдыязапісе.
Microsoft паказала сістэму VASA-1, якая генеруе рэалістычныя твары, што размаўляюць, усяго па адной фатаграфіі і аўдыязапісе.
VASA-1 выразна сінхранізуе рух вуснаў з гукавым фрагментам — прычым гэта могуць быць песні або маўленне не на англійскай мове, хоць мадэль на іх не вучылася, — і стварае рухі галавы, якія натуральна выглядаюць. Таксама нейрасетка перадае шырокі спектр эмоцый і тонкія нюансы мімікі, дзякуючы чаму ролікі выглядаюць яшчэ натуральнейшымі. Карыстальнік можа сам пазначыць, напрыклад, куды мае быць накіраваны позірк чалавека на відэа і ягоны настрой.
Распрацоўшчыкі падкрэсліваюць эфектыўнасць працы нейрасеткі ў рэжыме рэальнага часу. Яна здольная генераваць відэа з разрознасцю 512*512 пікселяў з частатой да 45 кадраў на секунду.
Падрабязней пра новую сістэму з прыкладамі кампанія расказала ў сваім блогу.
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.