🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

Исследователи используют игру Super Mario для оценки уровня ИИ

Исследователи используют игру Super Mario в качестве новой сложной задачи для оценки искусственного интеллекта. Платформа GamingAgent позволяет ИИ управлять Марио в реальном времени, выявляя неожиданные проблемы у моделей, основанных на рассуждениях.

Оставить комментарий
Исследователи используют игру Super Mario для оценки уровня ИИ

Исследователи используют игру Super Mario в качестве новой сложной задачи для оценки искусственного интеллекта. Платформа GamingAgent позволяет ИИ управлять Марио в реальном времени, выявляя неожиданные проблемы у моделей, основанных на рассуждениях.

Университетская лаборатория Hao AI Lab разработала платформу GamingAgent, чтобы интегрировать ИИ в игру Super Mario Bros. Платформа предоставляет ИИ основные инструкции и скриншоты из игры, позволяя моделям генерировать код Python для управления Марио.

Super Mario Bros. AI benchmark

Неожиданно модели ИИ, основанные на рассуждениях, показали результаты хуже, чем модели, не использующие рассуждения. Исследователи объясняют это тем, что моделям, основанным на рассуждениях, требуется больше времени на принятие решений, что критично в реальном времени, где важна каждая секунда.

Игры давно используются для оценки ИИ, но некоторые эксперты ставят под сомнение ценность таких тестов. В отличие от реального мира, игры абстрактны и предоставляют неограниченные данные для обучения ИИ.

Например, научный сотрудник OpenAI Андрей Карпатый отметил «кризис оценки» в области ИИ. Исследователь выразил сомнение в понимании того, насколько хороши современные модели ИИ, несмотря на их успехи в играх.

Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Meta, Google и OpenAI теряют топовых ИИ-исследователей — они уходят и сразу поднимают миллиарды
Meta, Google и OpenAI теряют топовых ИИ-исследователей — они уходят и сразу поднимают миллиарды
Meta, Google и OpenAI теряют топовых ИИ-исследователей — они уходят и сразу поднимают миллиарды
Профессор CS о том, что меняется для молодых разработчиков — и чему теперь учиться
Профессор CS о том, что меняется для молодых разработчиков — и чему теперь учиться
Профессор CS о том, что меняется для молодых разработчиков — и чему теперь учиться
ИИ меняет правила игры: EPAM о том, почему стратегии компаний «стареют» за три месяца
ИИ меняет правила игры: EPAM о том, почему стратегии компаний «стареют» за три месяца
ИИ меняет правила игры: EPAM о том, почему стратегии компаний «стареют» за три месяца
3 комментария
CEO Box объяснил, почему ИТ-сферу трясёт от ИИ-увольнений, а в остальной корпоративной Америке чуть ли не штиль
CEO Box объяснил, почему ИТ-сферу трясёт от ИИ-увольнений, а в остальной корпоративной Америке чуть ли не штиль
CEO Box объяснил, почему ИТ-сферу трясёт от ИИ-увольнений, а в остальной корпоративной Америке чуть ли не штиль

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.