Intel Labs показала нейросеть для создания 360-градусных панорамных изображений
Технология может стать революционной для отрасли: пользователь сможет по текстовому описанию создавать круговые панорамные изображения.
Компания представила латентную диффузионную ИИ-модель для создания панорманых трехмерных изображений (LDM3D) c 360-градусным обзором. Модель обучена на наборе данных, который создан из подмножества 10 тысяч образцов базы данных LAION-400M. Она содержит более 400 миллионов пар изображений и подписей к ним. Обучали модель на суперкомпьютере Intel AI на базе процессоров Intel Xeon и ускорителей Intel Habana Gaudi AI.
Для презентации возможностей LDM3D создатели модели разработали приложение DepthFusion. Она использует стандартные 2D-фотографии RGB и карты глубины для создания интерактивной 360-градусной панорамы. Разработчики предполагают, что исследование может революционизировать взаимодействие с цифровым контентом. Пользователь с помощью нейросети может превратить текстовое описание в панорамные изображения, а способность создавать карту глубины изображения повышает общий реализм и погружение.
Читать на dev.by