Исследователи DeepMind поделились игровым фреймворком обучения с подкреплением OpenSpiel, пишет VentureBeat.
OpenSpiel представляет собой набор сред и алгоритмов для исследований в области обучения с подкреплением, поиска и планирования в играх. Также здесь есть инструменты для анализа динамики обучения и другие оценочные метрики.
OpenSpiel поддерживает более 20 одно- и многопользовательских игр: кооперативные, игры с нулевой (при которой выигрыш одного равен проигрышу другого) и ненулевой суммой, одновременные и последовательные игры, матричные, с полной и неполной информацией и другие.
Создатели OpenSpiel уделили большое внимание двум качествам: простота и минимализм. В его основе — не полностью оптимизированный и высокопроизводительный код, а эталонные реализации.
Игры OpenSpiel написаны на C++ и обёрнуты в Python, некоторые кастомные среды обучения реализованы на Python, а алгоритмы — на обоих языках (некоторые функции написаны на Swift). По словам DeepMind, API для двух языков почти, и при необходимости код можно запросто преобразовать.
Разработчики говорят, что OpenSpiel пока тестировали на Linux (Debian 10 и Ubuntu 19.04), но так как он использует бесплатные инструменты, доступные для MacOS и Windows, сложностей с компиляцией и работой на этих платформах возникнуть не должно. Исходный код OpenSpiel доступен на GitHub.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.