🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

Исследователи используют игру Super Mario для оценки уровня ИИ

Исследователи используют игру Super Mario в качестве новой сложной задачи для оценки искусственного интеллекта. Платформа GamingAgent позволяет ИИ управлять Марио в реальном времени, выявляя неожиданные проблемы у моделей, основанных на рассуждениях.

Оставить комментарий
Исследователи используют игру Super Mario для оценки уровня ИИ

Исследователи используют игру Super Mario в качестве новой сложной задачи для оценки искусственного интеллекта. Платформа GamingAgent позволяет ИИ управлять Марио в реальном времени, выявляя неожиданные проблемы у моделей, основанных на рассуждениях.

Университетская лаборатория Hao AI Lab разработала платформу GamingAgent, чтобы интегрировать ИИ в игру Super Mario Bros. Платформа предоставляет ИИ основные инструкции и скриншоты из игры, позволяя моделям генерировать код Python для управления Марио.

Super Mario Bros. AI benchmark

Неожиданно модели ИИ, основанные на рассуждениях, показали результаты хуже, чем модели, не использующие рассуждения. Исследователи объясняют это тем, что моделям, основанным на рассуждениях, требуется больше времени на принятие решений, что критично в реальном времени, где важна каждая секунда.

Игры давно используются для оценки ИИ, но некоторые эксперты ставят под сомнение ценность таких тестов. В отличие от реального мира, игры абстрактны и предоставляют неограниченные данные для обучения ИИ.

Например, научный сотрудник OpenAI Андрей Карпатый отметил «кризис оценки» в области ИИ. Исследователь выразил сомнение в понимании того, насколько хороши современные модели ИИ, несмотря на их успехи в играх.

Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Треть сотрудников саботируют внедрение ИИ — боятся потерять работу
Треть сотрудников саботируют внедрение ИИ — боятся потерять работу
Треть сотрудников саботируют внедрение ИИ — боятся потерять работу
Автор «вайб-кодинга» запустил соцсеть для айтишников, за нейрослоп банят
Автор «вайб-кодинга» запустил соцсеть для айтишников, за нейрослоп банят
Автор «вайб-кодинга» запустил соцсеть для айтишников, за нейрослоп банят
1 комментарий
Claude Mythos сбежала из песочницы и сама рассказала об этом в сети
Claude Mythos сбежала из песочницы и сама рассказала об этом в сети
Claude Mythos сбежала из песочницы и сама рассказала об этом в сети
В ИТ с начала года уволили около 80 000, почти половина — из-за ИИ
В ИТ с начала года уволили около 80 000, почти половина — из-за ИИ
В ИТ с начала года уволили около 80 000, почти половина — из-за ИИ

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.