Гарри Поттер — самый популярный персонаж для изучения возможностей ИИ
Книги о Гарри Поттере стали идеальным материалом для изучения возможностей больших языковых моделей и технологий искусственного интеллекта.
Книги о Гарри Поттере стали идеальным материалом для изучения возможностей больших языковых моделей и технологий искусственного интеллекта.
Франшизу о Гарри Поттере все чаще используют для экспериментов с технологиями искусственного интеллекта из-за влияния франшизы на массовую культуру, широкого спектра языковых данных и сложной игры слов в книге. Сотрудники Microsoft Марк Руссинович и Ронен Элдан опубликовали научную статью «Кто такой Гарри Поттер?», в которой описана методика, помогающая большим языковым моделям выборочно забывать информацию.
Для моделей эта задача становится проблемой, поскольку обучающие базы данных включают произведения, защищенные авторским правом, из-за чего на разработчиков все чаще подают в суд. Исследователи показали, что модели можно изменять, удаляя оттуда любую информацию о существовании книг о Гарри Поттере, при этом не жертвуя творческими и аналитическими способностями системы.
Ученые Вашингтонского университета, Калифорнийского университета и Института искусственного интеллекта Аллена разработали языковую модель Silo, в которой есть функция удаления данных для снижения юридических рисков. Однако если удалить все спорные материалы и правительственные документы, то производительность модели снижается. При удалении книг о Гарри Поттере показатель перплексии — коэффициента неопределенности — повышался, что говорило о снижении качества модели.
Ученые по-разному используют материал из книг Роулинг для решения своих научных задач. Например, выходят статьи на такие темы: «Машинное обучение при создании зелий в Хогвартсе», «Гарри Поттер и большие языковые модели», «Обнаружение заклинаний в фэнтезийной литературе с помощью искусственного интеллекта на основе [архитектуры] трансформера». Гарри Поттер остается одним из самых любимых персонажей ученых.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.