Nvidia паказала нейрасетку з генерацыяй відэа паводле тэкставага апісання
Кампанія на канферэнцыі па камп’ютарным зроку IEEE паказала новую версію нейрасеткі, якая генеруе відэа паводле тэкставага апісання.
Паводле слоў распрацоўшчыкаў, навучанне ідзе нашмат хутчэй нават у параўнанні з мінулым месяцам. У якасці прыкладу Nvidia паказала карцінкі паводле запытаў «снежны чалавек у завіруху», «апранутая ў касцюм ліса, якая танцуе ў парку», «самотны падарожнік у туманным лесе» ды іншыя.
Відэа ствараецца ў разрознасці альбо 512×1024, альбо 1280×2048, ролік складаецца са 113 кадраў працягласцю каля пяці секунд. Паводле даных кампаніі, нейрасетка ўлічвае каля 4,1 мільярда параметраў, з якіх 2,7 мільярда навучаюцца на відэа. Раней кампанія дадала функцыю маштабавання відэа ў браўзерах. Нейрасетка Nvidia пакуль недаступная ў адкрытым доступе.
Читать на dev.by