Nvidia запустила облачную платформу для разработчиков Nvidia Maxine, которая призвана решить распространённые проблемы видеозвонков при помощи искусственного интеллекта, пишет The Verge.
Платформа работает на базе GPU от Nvidia. Она способна выравнивать положение лица пользователя в кадре, корректировать направление взгляда, чтобы он всегда смотрел в камеру, и освещение лица, а также создавать анимированные аватары.
Платформа определяет ключевые точки на лице пользователя и по ним воссоздаёт его на стороне собеседника. Метод на основе генеративно-состязательной нейросети позволяет сократить расход трафика при передаче видео и требования к пропускной способности подключения — по словам Nvidia, до одной десятой по сравнению со стандартом H.264, а также расходы для пользователей.
Помимо этого, сервис умеет улучшать качество потокового видео во время конференций, устранять шумы и позволяет интегрировать функции синхронного перевода и автоматического создания субтитров.
Инструментарий ориентирован на разработчиков видеосервисов. Открыт приём заявок на участие в программе раннего доступа. Пока Nvidia нашла одного партнёра для новой платформы — некоторые её функции решила опробовать американская компания в сфере корпоративных телекоммуникаций Avaya.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.