Support us

Вышел новый бенчмарк SuperGLUE в области понимания языка

Оставить комментарий
Вышел новый бенчмарк SuperGLUE в области понимания языка

Исследователи Facebook AI Research совместно с коллегами из DeepMind (Google), Вашингтонского и Нью-Йоркского университетов анонсировали SuperGLUE — ряд контрольных задач для оценки производительности мощного современного ИИ для задач понимания естественного языка, пишет VentureBeat.

В качестве эталона производительности учёные использовали модель BERT от Google, которая показывает state-of-the-art результаты по целому набору заданий. SuperGLUE по сложности превосходит бенчмарк General Language Understanding Evaluation (GLUE), выпущенный в прошлом апреле, и должен подстегнуть разработку моделей, способных обрабатывать более тонкие нюансы речи.

Новый бенчмарк включает 8 задач для проверки способности ИИ-систем понимать суть речи, распознавать причинно-следственные связи и давать ответы «да/нет» на вопросы по тестовым фрагментам.

Результаты лучших моделей будут публиковаться на super.gluebenchmark.com. Более подробно о SuperGLUE можно прочитать на arXiv.

Читайте также
ИИ помогает писать больше кода, но компании не успевают его проверять — сбои растут
ИИ помогает писать больше кода, но компании не успевают его проверять — сбои растут
ИИ помогает писать больше кода, но компании не успевают его проверять — сбои растут
2 комментария
Почему ИИ на работе так часто ошибается? Есть простое объяснение
Почему ИИ на работе так часто ошибается? Есть простое объяснение
Почему ИИ на работе так часто ошибается? Есть простое объяснение
Цукерберг: массовых увольнений в Meta больше не будет. Пока
Цукерберг: массовых увольнений в Meta больше не будет. Пока
Цукерберг: массовых увольнений в Meta больше не будет. Пока
Gemini удалил почти 30 000 строк кода и соврал разрабу о восстановлении
Gemini удалил почти 30 000 строк кода и соврал разрабу о восстановлении
Gemini удалил почти 30 000 строк кода и соврал разрабу о восстановлении

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.