Дапамажыце dev.by 🤍
Падтрымаць

DeepMind обучает ИИ командной работе на примере Quake III Arena

2 каментарыя
DeepMind обучает ИИ командной работе на примере Quake III Arena

Исследователи компании DeepMind обучили несколько ИИ-ботов играть в Quake III Arena в режиме «захват флага». Искусственный интеллект научился играть лучше людей — независимо от того, является ли его соперником человек или машина, пишет The Verge.

Чтобы обучить программу ориентироваться в сложном виртуальном пространстве без подробной информации, разработчики DeepMind использовали обучение с подкреплением. Боты не получали никаких инструкций о том, как играть в Quake III, и просто играли сами с собой, пока не вырабатывали победные стратегии. В таких тренировках программа обычно играет с собственным клоном. Одновременно исследователи обучали 30 различных систем с разнообразными стилями игры. Всего боты сыграли с собой 450 тысяч матчей продолжительностью пять минут каждый.

Алгоритмы обучались не только базовым правилам захвата флага (быстрее соперника захватить флаг с его базы и вернуть на свою), но и защищать свой флаг, размещаться на базе противника и отслеживать действия товарищей по команде, чтобы атаковать врага. Каждая игра происходила на новой местности — это гарантировало, что стратегия ПО не будет применима только к одной карте. При этом боты DeepMind не получали никаких цифровых данных по игре и обучались исключительно по картинке на экране.

Свои способности искусственный интеллект проявил в специально организованном DeepMind чемпионате, в ходе которого сражались команды из двух игроков — только ботов, только людей и смешанные. Наилучший результат показали команды, полностью состоящие из ботов — с вероятностью выигрыша 74 процента. Для сравнения, у сильных «живых» игроков эта цифра составляет 52 процента и 43 процента — у игроков средненго уровня. Также эксперименты показали, что чем больше ботов было в команде, тем хуже они взаимодействовали. Команда из четырёх ботов имела вероятность выигрыша 65 процентов.

График, иллюстрирующий коэффициент Эло (система расчёта относительной силы) различных игроков. Источник: DeepMind

Читайте также: Нейросеть OpenAI начала обыгрывать людей в Dota 2

Чытайце таксама
CEO Airbnb: калі не браць зумераў, кіраваць хутка будзе няма каму
CEO Airbnb: калі не браць зумераў, кіраваць хутка будзе няма каму
CEO Airbnb: калі не браць зумераў, кіраваць хутка будзе няма каму
ШІ заўважыў, што яго «ўзламалі» падчас эксперыменту
ШІ заўважыў, што яго «ўзламалі» падчас эксперыменту
ШІ заўважыў, што яго «ўзламалі» падчас эксперыменту
Meta абвінавацілі ў спампоўванні порна для ШІ. Кампанія заявіла, што спампоўвала
Meta абвінавацілі ў спампоўванні порна для ШІ. Кампанія заявіла, што спампоўвала "для сябе"
Meta абвінавацілі ў спампоўванні порна для ШІ. Кампанія заявіла, што спампоўвала "для сябе"
7 каментарыяў
Стваральнік ШІ-бота для тэхнічных сумоўяў назваў галоўную прычыну правалаў стартапаў
Стваральнік ШІ-бота для тэхнічных сумоўяў назваў галоўную прычыну правалаў стартапаў
Стваральнік ШІ-бота для тэхнічных сумоўяў назваў галоўную прычыну правалаў стартапаў

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.