Nvidia показала нейросеть с генерацией видео по текстовому описанию
Компания на конференции по компьютерному зрению IEEE представила новую версию нейросети, которая генерирует видео по текстовому описанию.
Компания на конференции по компьютерному зрению IEEE представила новую версию нейросети, которая генерирует видео по текстовому описанию.
По словам разработчиков, обучение идет намного быстрее даже по сравнению с прошлым месяцем. В качестве примера Nvidia показала картинки по запросам «снежный человек в снежную бурю», «одетая в костюм лиса, танцующая в парке», «одинокий путешественник в туманном лесу» и другие.
Видео создается в разрешении либо 512×1024, либо 1280×2048, ролик состоит из 113 кадров длиной около пяти секунд. По данным компании, нейросеть учитывает около 4,1 миллиарда параметров, из которых 2,7 миллиарда обучаются на видео. Ранее компания добавила функцию масштабирования видео в браузерах. Нейросеть Nvidia пока недоступна в открытом доступе.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.