Живете в Польше? Поддержите devby 1,5% налога: бесплатно и за 5 минут 🤗
Support us

Google выпустила датасет для тренировки продвинутых QA-систем

Оставить комментарий
Google выпустила датасет для тренировки продвинутых QA-систем

Google создала высококачественный корпус данных, включающий информационные запросы и ответы на них. Он предназначен для разработки вопросно-ответных (QA) систем, какие используются, например, в чат-ботах, сообщает VentureBeat.

Новый масштабный датасет Natural Questions для тренировки и оценки QA-систем, предполагающих владение общедоступными знаниями, Google представила в научной работе и блогпосте. По словам исследователей Google AI Language, инновационность разработки в том, что она целиком имитирует процесс поиска ответа на вопрос людьми.

Датасет состоит из более чем 300 тысяч запросов с аннотированными человеком ответами из Википедии. Его создавали на основе обезличенных запросов, собранных из поисковика Google, после чего аннотаторы должны были полностью прочитать статью энциклопедии и подобрать два варианта ответов: краткий и более развёрнутый. Оценочная точность аннотаций — 90 процентов.

Ранее Google открыла исходный код проекта ActiveQA для тренировки QA-агентов при помощи обучения с подкреплением, а также фреймворка BERT для обучения NLP-моделей на одном тензорном процессоре за 30 минут (или за несколько часов на нескольких GPU).

Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Индийские ИТ-компании потеряли $50 млрд из-за ИИ с начала февраля — худший результата почти за год
Индийские ИТ-компании потеряли $50 млрд из-за ИИ с начала февраля — худший результата почти за год
Индийские ИТ-компании потеряли $50 млрд из-за ИИ с начала февраля — худший результата почти за год
В сети вирусится кампания QuitGPT — бойкот ChatGPT
В сети вирусится кампания QuitGPT — бойкот ChatGPT
В сети вирусится кампания QuitGPT — бойкот ChatGPT
Из 300 сотрудников осталось 40. ИТ-предприниматель рассказывает, как LLM расставляют всё по своим местам
Из 300 сотрудников осталось 40. ИТ-предприниматель рассказывает, как LLM расставляют всё по своим местам
Из 300 сотрудников осталось 40. ИТ-предприниматель рассказывает, как LLM расставляют всё по своим местам
Работаете в ИТ и думаете, что через 5 лет у вас будет работа? Увы, но скорее всего нет. Эра величия программистов заканчивается, поэтому готовьтесь или адаптироваться, или менять работу.  Ведь десятилетие ничем не обоснованного роста зарплат и плюшек разработчикам закончилось. 
7 комментариев
ИИ-агент пристыдил разраба за то, что тот отклонил его код
ИИ-агент пристыдил разраба за то, что тот отклонил его код
ИИ-агент пристыдил разраба за то, что тот отклонил его код

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.