🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

Исследователи используют игру Super Mario для оценки уровня ИИ

Исследователи используют игру Super Mario в качестве новой сложной задачи для оценки искусственного интеллекта. Платформа GamingAgent позволяет ИИ управлять Марио в реальном времени, выявляя неожиданные проблемы у моделей, основанных на рассуждениях.

Оставить комментарий
Исследователи используют игру Super Mario для оценки уровня ИИ

Исследователи используют игру Super Mario в качестве новой сложной задачи для оценки искусственного интеллекта. Платформа GamingAgent позволяет ИИ управлять Марио в реальном времени, выявляя неожиданные проблемы у моделей, основанных на рассуждениях.

Университетская лаборатория Hao AI Lab разработала платформу GamingAgent, чтобы интегрировать ИИ в игру Super Mario Bros. Платформа предоставляет ИИ основные инструкции и скриншоты из игры, позволяя моделям генерировать код Python для управления Марио.

Super Mario Bros. AI benchmark

Неожиданно модели ИИ, основанные на рассуждениях, показали результаты хуже, чем модели, не использующие рассуждения. Исследователи объясняют это тем, что моделям, основанным на рассуждениях, требуется больше времени на принятие решений, что критично в реальном времени, где важна каждая секунда.

Игры давно используются для оценки ИИ, но некоторые эксперты ставят под сомнение ценность таких тестов. В отличие от реального мира, игры абстрактны и предоставляют неограниченные данные для обучения ИИ.

Например, научный сотрудник OpenAI Андрей Карпатый отметил «кризис оценки» в области ИИ. Исследователь выразил сомнение в понимании того, насколько хороши современные модели ИИ, несмотря на их успехи в играх.

Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
«Хватит паниковать»: эксперт призвал не преувеличивать угрозу ИИ для рынка труда
«Хватит паниковать»: эксперт призвал не преувеличивать угрозу ИИ для рынка труда
«Хватит паниковать»: эксперт призвал не преувеличивать угрозу ИИ для рынка труда
3 комментария
Что эффективнее: один ИИ-агент или несколько? Ответ не так очевиден
Что эффективнее: один ИИ-агент или несколько? Ответ не так очевиден
Что эффективнее: один ИИ-агент или несколько? Ответ не так очевиден
Бизнесмены-одиночки отказываются от подписок — и экономят тысячи с ИИ
Бизнесмены-одиночки отказываются от подписок — и экономят тысячи с ИИ
Бизнесмены-одиночки отказываются от подписок — и экономят тысячи с ИИ
Claude Cowork теперь доступен всем с новыми функциями для бизнеса
Claude Cowork теперь доступен всем с новыми функциями для бизнеса
Claude Cowork теперь доступен всем с новыми функциями для бизнеса

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.