Support us

DeepMind обучает ИИ командной работе на примере Quake III Arena

2 комментария
DeepMind обучает ИИ командной работе на примере Quake III Arena

Исследователи компании DeepMind обучили несколько ИИ-ботов играть в Quake III Arena в режиме «захват флага». Искусственный интеллект научился играть лучше людей — независимо от того, является ли его соперником человек или машина, пишет The Verge.

Чтобы обучить программу ориентироваться в сложном виртуальном пространстве без подробной информации, разработчики DeepMind использовали обучение с подкреплением. Боты не получали никаких инструкций о том, как играть в Quake III, и просто играли сами с собой, пока не вырабатывали победные стратегии. В таких тренировках программа обычно играет с собственным клоном. Одновременно исследователи обучали 30 различных систем с разнообразными стилями игры. Всего боты сыграли с собой 450 тысяч матчей продолжительностью пять минут каждый.

Алгоритмы обучались не только базовым правилам захвата флага (быстрее соперника захватить флаг с его базы и вернуть на свою), но и защищать свой флаг, размещаться на базе противника и отслеживать действия товарищей по команде, чтобы атаковать врага. Каждая игра происходила на новой местности — это гарантировало, что стратегия ПО не будет применима только к одной карте. При этом боты DeepMind не получали никаких цифровых данных по игре и обучались исключительно по картинке на экране.

Свои способности искусственный интеллект проявил в специально организованном DeepMind чемпионате, в ходе которого сражались команды из двух игроков — только ботов, только людей и смешанные. Наилучший результат показали команды, полностью состоящие из ботов — с вероятностью выигрыша 74 процента. Для сравнения, у сильных «живых» игроков эта цифра составляет 52 процента и 43 процента — у игроков средненго уровня. Также эксперименты показали, что чем больше ботов было в команде, тем хуже они взаимодействовали. Команда из четырёх ботов имела вероятность выигрыша 65 процентов.

График, иллюстрирующий коэффициент Эло (система расчёта относительной силы) различных игроков. Источник: DeepMind

Читайте также: Нейросеть OpenAI начала обыгрывать людей в Dota 2

Читайте также
ИИ помогает писать больше кода, но компании не успевают его проверять — сбои растут
ИИ помогает писать больше кода, но компании не успевают его проверять — сбои растут
ИИ помогает писать больше кода, но компании не успевают его проверять — сбои растут
2 комментария
Почему ИИ на работе так часто ошибается? Есть простое объяснение
Почему ИИ на работе так часто ошибается? Есть простое объяснение
Почему ИИ на работе так часто ошибается? Есть простое объяснение
Цукерберг: массовых увольнений в Meta больше не будет. Пока
Цукерберг: массовых увольнений в Meta больше не будет. Пока
Цукерберг: массовых увольнений в Meta больше не будет. Пока
Gemini удалил почти 30 000 строк кода и соврал разрабу о восстановлении
Gemini удалил почти 30 000 строк кода и соврал разрабу о восстановлении
Gemini удалил почти 30 000 строк кода и соврал разрабу о восстановлении

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.