Исследователи Amazon Alexa представили метод добавления новых типов данных в классификаторы с использованием только тренировочных данных для нового класса, пишет VentureBeat.
Задача классификаторов — разделять данные по типу (фото, видео, предметы, аудио), и сегодня они справляются с ней достаточно хорошо. Но добавить в алгоритм новый класс обычно очень трудно, так как это требует сбора большого количества данных и перетренировки модели.
В своей работе учёные Amazon показали возможность переноса ИИ-системы и её параметров на новую систему, обученную идентифицировать дополнительный класс.
По словам исследователей, вопрос адаптирования существующих сетей к новым типам данных особенно важен для голосовых ассистентов. Описанные ими метод адаптации — или перенос обучения — позволил бы сторонним разработчикам навыков напрямую использовать частные системы Amazon без необходимости доступа к её тренировочным данным.
В работе исследователи добавляли новый класс в нейросеть, обученную распознавать людей и компании в онлайн-публикациях. Они пропустили выходные данные изначального классификатора через отдельную нейросеть (адаптер), чьи выходные данные отправили на второй параллельный классификатор, обученный на данных по новому классу. Далее учёные совместно обучали адаптер и второй классификатор. В результате они получили новую нейросеть для распознавания мест, обученную с помощью сети для распознавания людей и компаний с её параметрами.
В испытаниях двух нейросетевых архитектур и двух методов переноса обучения им удалось достичь точности нейросетей в 91,08 процента на изначальных данных и 90,73 процента — на новых.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.