Отдел новостей 5 марта 2019, 17:30

OpenAI запустила нейронный симулятор Neural MMO

OpenAI выпустила симулятор Neural MMO для тренировки большого количества агентов обучения с подкреплением в PRG-средах, пишет VentureBeat.

Платформа Neural MMO создаёт «тайловые» окружения, состоящие из плиток заданного размера: проходимых, например лес или трава, и непроходимых (вода или камень). Задача ботов — собрать ограниченные в каждый момент времени ресурсы (еду и воду) и атаковать противников (команды других агентов). Уничтожение соперников означает меньшую конкуренцию за ресурсы, и соответственно, более высокую вероятность выживания. Вознаграждение агенты получают за то, что продержались в игре максимально долго.

Исследователи обнаружили, что чем дольше агенты взаимодействовали друг с другом, тем лучше становились в определённых задачах, а увеличение числа параллельных агентов стимулировало поиск ресурсов. Также исследователи заметили, что с увеличением своей численности агенты стремились рассредоточиться по разным частям карты с достаточным количеством ресурсов, и что агенты, тренируемые в более крупных средах стабильно превосходили тех, которые обучались на менее масштабных локациях.

Neural MMO поддерживает до 100 млн жизней 128 одновременно обучаемых агентов на 100 параллельных игровых серверах. Разработчики могут использовать симулятор для создания своих алгоритмов обучения с подкреплением для применения в ботах для ММО-игр. Симулятор доступен на GitHub.

По словам OpenAI, многоагентные окружения показали свою эффективность для исследований глубокого обучения с подкреплением. Но несмотря на прогресс, есть две проблемы. Необходимо создавать задачи открытого типа с высоким потолком сложности: нынешние среды либо сложны, но слишком «узки», либо открыты и слишком просты. Также требуется больше эталонных сред для измерения успешности обучения в присутствии множества агентов и их живучести. Жанр массовых многопользовательских онлайн-игр имитирует большую экосистему с переменным числом игроков, борющихся за выживание в разнообразных средах.

По теме

«Потолок карьеры с PhD намного выше, чем без». Денис Ярец изучает AI в научной лаборатории Facebook. Говорим про ML, RL, мотивацию и перспективы

Все материалы по теме

Оставить комментарий

Текст: Отдел новостей Фото: VentureBeat Источник: VentureBeat Теги: openai, обучение с подкреплением, машинное обучение, симулятор

Нашли ошибку в тексте-выделите ее и нажмите Ctrl+Enter. Нашли ошибку в тексте-выделите ее и нажмите кнопку «Сообщить об ошибке»."

Сайт компании Вакансии

Размещение рекламы

TinyML, No-code и обучение с подкреплением: новейшие тренды в машинном обучении

Пока 20% топ-менеджеров утверждают, что машинное обучение является существенной частью их бизнеса, неудивительно, что стоимость мирового рынка машинного обучения, по некоторым оценкам, достигнет $117 млрд к концу 2027 года. Мы перевели материал Udacity о семи самых обсуждаемых тенденциях в машинном обучении в 2022 году.