Исследователи лаборатории MIT-IBM Watson AI Lab придумали способ уменьшить размер алгоритмов по распознаванию видео, а также ускорить их обучение и потенциально — улучшить производительность на мобильных устройствах, пишет Engadget.
Учёным удалось сделать это, изменив «восприятие» времени моделями по распознаванию роликов. Сегодняшние модели кодируют поток времени в последовательность изображений, в результате чего модели получаются более массивными и затратными с вычислительной точки зрения. Исследователи MIT-IBM разработали модуль временного сдвига, благодаря которому модель понимает ход времени без его явного представления.
В тестах новый метод позволил обучить модели глубокого обучения для распознавания видео в три раза быстрее существующих. Модуль временного сдвига также может облегчить запуск и работу таких моделей на мобильных устройствах.
«Наша цель — сделать AI доступным для любого пользователя маломощных устройств. Для этого нужно создать эффективные AI-модели с меньшим энергопотреблением, которые способны гладко работать на граничных устройствах, куда сейчас смещается значительная часть AI», — отмечают исследователи.
Сокращение затрат электричество благоприятно отразится на экологии, так как приведёт к снижению выбросов СО2 в атмосферу. Кроме того, новое изобретение поможет платформам вроде Facebook и YouTube оперативно выявлять ролики, продвигающие терроризм и насилие. Медицинские организации, например больницы, смогут использовать AI-приложения не в облаке, а локально, что обеспечит лучшую защиту конфиденциальных данных.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.