Дапамажыце dev.by 🤍
Падтрымаць

DeepMind обучает ИИ командной работе на примере Quake III Arena

2 каментарыя
DeepMind обучает ИИ командной работе на примере Quake III Arena

Исследователи компании DeepMind обучили несколько ИИ-ботов играть в Quake III Arena в режиме «захват флага». Искусственный интеллект научился играть лучше людей — независимо от того, является ли его соперником человек или машина, пишет The Verge.

Чтобы обучить программу ориентироваться в сложном виртуальном пространстве без подробной информации, разработчики DeepMind использовали обучение с подкреплением. Боты не получали никаких инструкций о том, как играть в Quake III, и просто играли сами с собой, пока не вырабатывали победные стратегии. В таких тренировках программа обычно играет с собственным клоном. Одновременно исследователи обучали 30 различных систем с разнообразными стилями игры. Всего боты сыграли с собой 450 тысяч матчей продолжительностью пять минут каждый.

Алгоритмы обучались не только базовым правилам захвата флага (быстрее соперника захватить флаг с его базы и вернуть на свою), но и защищать свой флаг, размещаться на базе противника и отслеживать действия товарищей по команде, чтобы атаковать врага. Каждая игра происходила на новой местности — это гарантировало, что стратегия ПО не будет применима только к одной карте. При этом боты DeepMind не получали никаких цифровых данных по игре и обучались исключительно по картинке на экране.

Свои способности искусственный интеллект проявил в специально организованном DeepMind чемпионате, в ходе которого сражались команды из двух игроков — только ботов, только людей и смешанные. Наилучший результат показали команды, полностью состоящие из ботов — с вероятностью выигрыша 74 процента. Для сравнения, у сильных «живых» игроков эта цифра составляет 52 процента и 43 процента — у игроков средненго уровня. Также эксперименты показали, что чем больше ботов было в команде, тем хуже они взаимодействовали. Команда из четырёх ботов имела вероятность выигрыша 65 процентов.

График, иллюстрирующий коэффициент Эло (система расчёта относительной силы) различных игроков. Источник: DeepMind

Читайте также: Нейросеть OpenAI начала обыгрывать людей в Dota 2

Чытайце таксама
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Meta прымушае супрацоўнікаў выкарыстоўваць ШІ. Вось якія планкі
Meta прымушае супрацоўнікаў выкарыстоўваць ШІ. Вось якія планкі
Meta прымушае супрацоўнікаў выкарыстоўваць ШІ. Вось якія планкі

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.