Отдел новостей 26 августа 2016, 15:41

Facebook открыла код системы распознавания изображений

Подразделение Facebook по исследованиям в области искусственного интеллекта открыло код ПО для распознавания изображений. В компании считают, что такой шаг поможет ускорить разработку и сделать возможным распознавание объектов на видео, пишет Digital Trends. Проекты DeepMask, SharpMask и MultiPathNet уже доступны на GitHub.

Фото: Digital Trends

В настоящее время алгоритмы Facebook работают с конволюционной нейронной системой MultiPathNet — она получает большие объёмы данных и в конце концов начинает распознавать инфмормацию, позволяя Facebook понимать изображения.

Для того, чтобы классифицировать и «пометить» объекты на картинке, работает связка DeepMask, фреймворка для сегментации, и SharpMask, модуля «очищения» сегментов. На финальной стадии процесса система машинного зрения использует глубоко обучаемый искусственный интеллект MultiPathNet для классификации каждого объекта на снимке.

Иллюстрация: Digital Trends

Facebook утверждает, что открытие кода критически важно для улучшения возможностей распознавания изображений.

При этом у компании есть понимание того, где будет использоваться усовершенствованная технология: одним из важных направлений работы в социальной сети называют построение звуковых описаний изображений для пользователей с нарушениями зрения.

Следующим шагом в Facebook называют использование техник распознавания изображения в работе с видео и даже в прямых трансляциях Facebook Live, для которых улучшится точность определения релевантных и важных роликов. В конце концов развитие технологии может привести к возможности параллельного повествования, в котором искусственный интеллект будет описывать события, происходящие на видео, считает работник Facebook AI Research Пётр Доллар.