Подразделение Facebook по исследованиям в области искусственного интеллекта открыло код ПО для распознавания изображений. В компании считают, что такой шаг поможет ускорить разработку и сделать возможным распознавание объектов на видео, пишет Digital Trends. Проекты DeepMask, SharpMask и MultiPathNet уже доступны на GitHub.
В настоящее время алгоритмы Facebook работают с конволюционной нейронной системой MultiPathNet — она получает большие объёмы данных и в конце концов начинает распознавать инфмормацию, позволяя Facebook понимать изображения.
Для того, чтобы классифицировать и «пометить» объекты на картинке, работает связка DeepMask, фреймворка для сегментации, и SharpMask, модуля «очищения» сегментов. На финальной стадии процесса система машинного зрения использует глубоко обучаемый искусственный интеллект MultiPathNet для классификации каждого объекта на снимке.
Facebook утверждает, что открытие кода критически важно для улучшения возможностей распознавания изображений.
При этом у компании есть понимание того, где будет использоваться усовершенствованная технология: одним из важных направлений работы в социальной сети называют построение звуковых описаний изображений для пользователей с нарушениями зрения.
Следующим шагом в Facebook называют использование техник распознавания изображения в работе с видео и даже в прямых трансляциях Facebook Live, для которых улучшится точность определения релевантных и важных роликов. В конце концов развитие технологии может привести к возможности параллельного повествования, в котором искусственный интеллект будет описывать события, происходящие на видео, считает работник Facebook AI Research Пётр Доллар.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.