404 Media: Nvidia скачивала петабайты роликов Youtube и Netflix для обучения ИИ
Компанию заподозрили в нарушении авторского права: Nvidia могла игнорировать запреты платформ и скачивать миллионы роликов для обучения своих ИИ-моделей.
Журналисты 404 Media получили доступ к внутренним документам компании, в которых был описан проект под кодовым названием Cosmos. Согласно описанию, каждый день сотрудники загружали огромные объемы видео с различных сервисов, в том числе Youtube и Netflix. Объем обработанного материала равнялся приблизительно 80 годам непрерывного просмотра.
Цель сбора данных — несколько ИИ-проектов Nvidia, в том числе создание метавселенной Omniverse 3D world generator. Эта программа позволяет создавать трехмерные модели и виртуальные миры с помощью нейросетей и искусственного интеллекта. Также данные необходимы для улучшения технологий беспилотных автомобилей и разработки цифровых ассистентов.
В компании заявили, что не нарушали авторское право, так как используют только идеи и нформацию, а не готовые продукты. Также Nvidia отметила, что обучение ИИ-моделей подпадает под понятие «добросовестное использование». Также чтобы избежать обнаружения со стороны YouTube, Nvidia якобы загружала контент с помощью виртуальных машин с изменяющимися IP-адресами.
Читать на dev.by