Дапамажыце dev.by 🤍
Падтрымаць

Google выпустила датасет для тренировки продвинутых QA-систем

Пакінуць каментарый
Google выпустила датасет для тренировки продвинутых QA-систем

Google создала высококачественный корпус данных, включающий информационные запросы и ответы на них. Он предназначен для разработки вопросно-ответных (QA) систем, какие используются, например, в чат-ботах, сообщает VentureBeat.

Новый масштабный датасет Natural Questions для тренировки и оценки QA-систем, предполагающих владение общедоступными знаниями, Google представила в научной работе и блогпосте. По словам исследователей Google AI Language, инновационность разработки в том, что она целиком имитирует процесс поиска ответа на вопрос людьми.

Датасет состоит из более чем 300 тысяч запросов с аннотированными человеком ответами из Википедии. Его создавали на основе обезличенных запросов, собранных из поисковика Google, после чего аннотаторы должны были полностью прочитать статью энциклопедии и подобрать два варианта ответов: краткий и более развёрнутый. Оценочная точность аннотаций — 90 процентов.

Ранее Google открыла исходный код проекта ActiveQA для тренировки QA-агентов при помощи обучения с подкреплением, а также фреймворка BERT для обучения NLP-моделей на одном тензорном процессоре за 30 минут (или за несколько часов на нескольких GPU).

Чытайце таксама
У ЗША выйграна першая справа аб залежнасці ад сацсетак — Meta і Google пакараны за тое, як пабудаваны іх платформы
У ЗША выйграна першая справа аб залежнасці ад сацсетак — Meta і Google пакараны за тое, як пабудаваны іх платформы
У ЗША выйграна першая справа аб залежнасці ад сацсетак — Meta і Google пакараны за тое, як пабудаваны іх платформы
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.