Support us

Исследователи используют игру Super Mario для оценки уровня ИИ

Исследователи используют игру Super Mario в качестве новой сложной задачи для оценки искусственного интеллекта. Платформа GamingAgent позволяет ИИ управлять Марио в реальном времени, выявляя неожиданные проблемы у моделей, основанных на рассуждениях.

Оставить комментарий
Исследователи используют игру Super Mario для оценки уровня ИИ

Исследователи используют игру Super Mario в качестве новой сложной задачи для оценки искусственного интеллекта. Платформа GamingAgent позволяет ИИ управлять Марио в реальном времени, выявляя неожиданные проблемы у моделей, основанных на рассуждениях.

Университетская лаборатория Hao AI Lab разработала платформу GamingAgent, чтобы интегрировать ИИ в игру Super Mario Bros. Платформа предоставляет ИИ основные инструкции и скриншоты из игры, позволяя моделям генерировать код Python для управления Марио.

Super Mario Bros. AI benchmark

Неожиданно модели ИИ, основанные на рассуждениях, показали результаты хуже, чем модели, не использующие рассуждения. Исследователи объясняют это тем, что моделям, основанным на рассуждениях, требуется больше времени на принятие решений, что критично в реальном времени, где важна каждая секунда.

Игры давно используются для оценки ИИ, но некоторые эксперты ставят под сомнение ценность таких тестов. В отличие от реального мира, игры абстрактны и предоставляют неограниченные данные для обучения ИИ.

Например, научный сотрудник OpenAI Андрей Карпатый отметил «кризис оценки» в области ИИ. Исследователь выразил сомнение в понимании того, насколько хороши современные модели ИИ, несмотря на их успехи в играх.

Читайте также
«Дважды два не четыре»: исследователи обманули ИИ промпт-атаками нового типа
«Дважды два не четыре»: исследователи обманули ИИ промпт-атаками нового типа
«Дважды два не четыре»: исследователи обманули ИИ промпт-атаками нового типа
Claude взломал билетную систему крупнейших фестивалей США
Claude взломал билетную систему крупнейших фестивалей США
Claude взломал билетную систему крупнейших фестивалей США
Воры охотятся за медью и оборудованием для ИИ-дата-центров
Воры охотятся за медью и оборудованием для ИИ-дата-центров
Воры охотятся за медью и оборудованием для ИИ-дата-центров
Синдром «няньки для роботов»: топ-менеджер уволила половину своих ИИ-агентов
Синдром «няньки для роботов»: топ-менеджер уволила половину своих ИИ-агентов
Синдром «няньки для роботов»: топ-менеджер уволила половину своих ИИ-агентов

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.