Беларусь + FemTech = ❤️? Stork целится в миллион установок
Support us

Google выпустила датасет для тренировки продвинутых QA-систем

Оставить комментарий
Google выпустила датасет для тренировки продвинутых QA-систем

Google создала высококачественный корпус данных, включающий информационные запросы и ответы на них. Он предназначен для разработки вопросно-ответных (QA) систем, какие используются, например, в чат-ботах, сообщает VentureBeat.

Новый масштабный датасет Natural Questions для тренировки и оценки QA-систем, предполагающих владение общедоступными знаниями, Google представила в научной работе и блогпосте. По словам исследователей Google AI Language, инновационность разработки в том, что она целиком имитирует процесс поиска ответа на вопрос людьми.

Датасет состоит из более чем 300 тысяч запросов с аннотированными человеком ответами из Википедии. Его создавали на основе обезличенных запросов, собранных из поисковика Google, после чего аннотаторы должны были полностью прочитать статью энциклопедии и подобрать два варианта ответов: краткий и более развёрнутый. Оценочная точность аннотаций — 90 процентов.

Ранее Google открыла исходный код проекта ActiveQA для тренировки QA-агентов при помощи обучения с подкреплением, а также фреймворка BERT для обучения NLP-моделей на одном тензорном процессоре за 30 минут (или за несколько часов на нескольких GPU).

Читайте также
CEO Google говорит, что с вайб-кодингом разрабатывать софт снова стало в кайф
CEO Google говорит, что с вайб-кодингом разрабатывать софт снова стало в кайф
CEO Google говорит, что с вайб-кодингом разрабатывать софт снова стало в кайф
Google урезала доступ к Pro-версиям Gemini 3 и Nano Banana, Alibaba делит клиентов по приоритету — компании страдают от популярности
Google урезала доступ к Pro-версиям Gemini 3 и Nano Banana, Alibaba делит клиентов по приоритету — компании страдают от популярности
Google урезала доступ к Pro-версиям Gemini 3 и Nano Banana, Alibaba делит клиентов по приоритету — компании страдают от популярности
ИИ уже сейчас может заменить 12% американских работников
ИИ уже сейчас может заменить 12% американских работников
ИИ уже сейчас может заменить 12% американских работников
2 комментария
Сооснователь OpenAI: главная стратегия развития ИИ исчерпала себя — нужно возвращаться к научным истокам
Сооснователь OpenAI: главная стратегия развития ИИ исчерпала себя — нужно возвращаться к научным истокам
Сооснователь OpenAI: главная стратегия развития ИИ исчерпала себя — нужно возвращаться к научным истокам

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.