Живете в Польше? Поддержите devby 1,5% налога: бесплатно и за 5 минут 🤗
Support us

Исследователи используют игру Super Mario для оценки уровня ИИ

Исследователи используют игру Super Mario в качестве новой сложной задачи для оценки искусственного интеллекта. Платформа GamingAgent позволяет ИИ управлять Марио в реальном времени, выявляя неожиданные проблемы у моделей, основанных на рассуждениях.

Оставить комментарий
Исследователи используют игру Super Mario для оценки уровня ИИ

Исследователи используют игру Super Mario в качестве новой сложной задачи для оценки искусственного интеллекта. Платформа GamingAgent позволяет ИИ управлять Марио в реальном времени, выявляя неожиданные проблемы у моделей, основанных на рассуждениях.

Университетская лаборатория Hao AI Lab разработала платформу GamingAgent, чтобы интегрировать ИИ в игру Super Mario Bros. Платформа предоставляет ИИ основные инструкции и скриншоты из игры, позволяя моделям генерировать код Python для управления Марио.

Super Mario Bros. AI benchmark

Неожиданно модели ИИ, основанные на рассуждениях, показали результаты хуже, чем модели, не использующие рассуждения. Исследователи объясняют это тем, что моделям, основанным на рассуждениях, требуется больше времени на принятие решений, что критично в реальном времени, где важна каждая секунда.

Игры давно используются для оценки ИИ, но некоторые эксперты ставят под сомнение ценность таких тестов. В отличие от реального мира, игры абстрактны и предоставляют неограниченные данные для обучения ИИ.

Например, научный сотрудник OpenAI Андрей Карпатый отметил «кризис оценки» в области ИИ. Исследователь выразил сомнение в понимании того, насколько хороши современные модели ИИ, несмотря на их успехи в играх.

Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
ИИ обвалил акции финансовых компаний
ИИ обвалил акции финансовых компаний
ИИ обвалил акции финансовых компаний
Cisco представила новый ИИ-чип для сетевой инфраструктуры, посоперничает с Nvidia и Broadcom
Cisco представила новый ИИ-чип для сетевой инфраструктуры, посоперничает с Nvidia и Broadcom
Cisco представила новый ИИ-чип для сетевой инфраструктуры, посоперничает с Nvidia и Broadcom
«Она спасла мне жизнь»: OpenAI отключает GPT-4o — пользователи взбунтовались
«Она спасла мне жизнь»: OpenAI отключает GPT-4o — пользователи взбунтовались
«Она спасла мне жизнь»: OpenAI отключает GPT-4o — пользователи взбунтовались
Компании рискуют стать «машинами для выгорания» из-за ИИ — исследование
Компании рискуют стать «машинами для выгорания» из-за ИИ — исследование
Компании рискуют стать «машинами для выгорания» из-за ИИ — исследование

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.