Исследователи Facebook и Университета Карнеги-Меллона создали бота, который оказался сильнее нескольких профессиональных покеристов, пишет Engadget.
Боты уже умеют выигрывать многие сложные игры в матчах «один на один». По словам Facebook, Pluribus — первый в мире бот, который смог победить, играя одновременно с несколькими оппонентами. ИИ оказался сильнее профессионалов в двух форматах техасского холдема: 5 ботов против 1 человека и 1 бот против 5 человек. Исследователи называют этого мультиплеерного бота знаковым достижением искусственного интеллекта.
Отличие покера от шахмат или го в присутствии скрытой информации — карт противника. Это требует обучения иным сложным стратегиям, которых нет в других играх, например блеф, который сильно повышает шансы на успех, но пока давался ботам непросто.
Pluribus основан на алгоритме онлайн-поиска, с помощью которого может искать варианты действий на несколько ходов вперёд, а не до конца игры. Также он имел более мощные алгоритмы при тренировке с самим собой, которые делали обучение справляться со скрытой информацией эффективнее.
Бот занимает 28 Гб памяти и работает на двух GPU. Для сравнения, AlphaGo в матче против Ли Седоля в 2016 году требовал 1920 CPU и 280 GPU. Pluribus обычно играет в два раза быстрее профессионалов, требуя в среднем 20 секунд на руку в игре со своими копиями. По словам Facebook, в среднем он мог бы зарабатывать по $1 тысяче в час.
В течение 12 дней бот разыграл 10 тысяч рук с несколькими победителями Мировой серии покера и Мирового тура покера. Они отметили непривычные тактики, которые использовал бот, а также что играть с ним было непросто.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.