Дапамажыце dev.by 🤍
Падтрымаць

Google выпустила датасет для тренировки продвинутых QA-систем

Пакінуць каментарый
Google выпустила датасет для тренировки продвинутых QA-систем

Google создала высококачественный корпус данных, включающий информационные запросы и ответы на них. Он предназначен для разработки вопросно-ответных (QA) систем, какие используются, например, в чат-ботах, сообщает VentureBeat.

Новый масштабный датасет Natural Questions для тренировки и оценки QA-систем, предполагающих владение общедоступными знаниями, Google представила в научной работе и блогпосте. По словам исследователей Google AI Language, инновационность разработки в том, что она целиком имитирует процесс поиска ответа на вопрос людьми.

Датасет состоит из более чем 300 тысяч запросов с аннотированными человеком ответами из Википедии. Его создавали на основе обезличенных запросов, собранных из поисковика Google, после чего аннотаторы должны были полностью прочитать статью энциклопедии и подобрать два варианта ответов: краткий и более развёрнутый. Оценочная точность аннотаций — 90 процентов.

Ранее Google открыла исходный код проекта ActiveQA для тренировки QA-агентов при помощи обучения с подкреплением, а также фреймворка BERT для обучения NLP-моделей на одном тензорном процессоре за 30 минут (или за несколько часов на нескольких GPU).

Чытайце таксама
Бігтэх махлярыць са справаздачнасцю — меркаванне інвестара, які прадказаў крызіс 2008 года
Бігтэх махлярыць са справаздачнасцю — меркаванне інвестара, які прадказаў крызіс 2008 года
Бігтэх махлярыць са справаздачнасцю — меркаванне інвестара, які прадказаў крызіс 2008 года
Google укараняе агентны шопінг: ШІ сам шукае, параўноўвае і купляе тавары
Google укараняе агентны шопінг: ШІ сам шукае, параўноўвае і купляе тавары
Google укараняе агентны шопінг: ШІ сам шукае, параўноўвае і купляе тавары
Microsoft хоча змяніць падпіскі: плаціць давядзецца за ШІ-агентаў, а не за людзей
Microsoft хоча змяніць падпіскі: плаціць давядзецца за ШІ-агентаў, а не за людзей
Microsoft хоча змяніць падпіскі: плаціць давядзецца за ШІ-агентаў, а не за людзей
Кепскія навіны для тых, хто не любіць галасавыя паведамленні: праз 5 гадоў праца будзе будавацца на іх
Кепскія навіны для тых, хто не любіць галасавыя паведамленні: праз 5 гадоў праца будзе будавацца на іх
Кепскія навіны для тых, хто не любіць галасавыя паведамленні: праз 5 гадоў праца будзе будавацца на іх
6 каментарыяў

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.