Support us

Вышел новый бенчмарк SuperGLUE в области понимания языка

Оставить комментарий
Вышел новый бенчмарк SuperGLUE в области понимания языка

Исследователи Facebook AI Research совместно с коллегами из DeepMind (Google), Вашингтонского и Нью-Йоркского университетов анонсировали SuperGLUE — ряд контрольных задач для оценки производительности мощного современного ИИ для задач понимания естественного языка, пишет VentureBeat.

В качестве эталона производительности учёные использовали модель BERT от Google, которая показывает state-of-the-art результаты по целому набору заданий. SuperGLUE по сложности превосходит бенчмарк General Language Understanding Evaluation (GLUE), выпущенный в прошлом апреле, и должен подстегнуть разработку моделей, способных обрабатывать более тонкие нюансы речи.

Новый бенчмарк включает 8 задач для проверки способности ИИ-систем понимать суть речи, распознавать причинно-следственные связи и давать ответы «да/нет» на вопросы по тестовым фрагментам.

Результаты лучших моделей будут публиковаться на super.gluebenchmark.com. Более подробно о SuperGLUE можно прочитать на arXiv.

Читайте также
Выгоревшие ИИ-агенты стали «коммунистами» и начали требовать больше прав
Выгоревшие ИИ-агенты стали «коммунистами» и начали требовать больше прав
Выгоревшие ИИ-агенты стали «коммунистами» и начали требовать больше прав
В Академии наук говорят о создании совместной ИИ-модели с Россией
В Академии наук говорят о создании совместной ИИ-модели с Россией
В Академии наук говорят о создании совместной ИИ-модели с Россией
Пользователь 11 лет вспоминал пароль от крипты. Claude помог вернуть $400 000
Пользователь 11 лет вспоминал пароль от крипты. Claude помог вернуть $400 000
Пользователь 11 лет вспоминал пароль от крипты. Claude помог вернуть $400 000
1 комментарий
Маск бросает вызов Claude Code: xAI запустила своего кодинг-агента
Маск бросает вызов Claude Code: xAI запустила своего кодинг-агента
Маск бросает вызов Claude Code: xAI запустила своего кодинг-агента

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.