В лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института разработали очередную интересную технологию: алгоритм умеет различать инструменты на видео, узнавать их на пиксельном уровне и выделять нужные на передний план, пишет Engadget.
В случае, если на видео играет несколько инструментов, PixelPlayer позволит выбирать один их них — и повысит его громкость, приглушив остальные.
Специалисты лаборатории обучали алгоритм с помощью самоконтролируемой техники глубинного обучения и 60 часов видео с записью исполнения различных музыкальных композиций. Сегодня PixelPlayer умеет различать 20 инструментов, но с трудом определяет те, что звучат похоже.
Создатели утверждают, что в ходе совершенствования технологии она может стать эффективным инструментом для работы с аудио — например, для улучшения качества давно записанных концертов. Её также можно применять для того, чтобы роботы могли отличать разные звуки окружающей среды.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.