Support us

Google выпустила новый диалоговый датасет для обучения виртуальных ассистентов

1 комментарий
Google выпустила новый диалоговый датасет для обучения виртуальных ассистентов

Исследователи Google опубликовали датасет Schema-Guided Dialogue (SGD) — крупнейший из находящихся в открытом доступе набор диалогов, разбитых по тематикам, пишет VentureBeat.

По словам исследователей, сегодня происходит интеграция голосовых ассистентов вроде Google Assistant со всё новыми сервисами в самых разнообразных сферах деятельности. Датасет должен способствовать обучению систем, способных поддерживать эти сервисы без необходимости дополнительно собирать данные или заново тренировать модель, а также снижению затрат на их дальнейшее развитие.

SGD содержит 18 тысяч проблемно-ориентированных размеченных диалогов между людьми и виртуальным ассистентом и может применяться для таких задач, как прогнозирование интентов пользователя, парсинг семантики, анализ диалога, синтез речи и других. Диалоги представлены по 17 различным темам, включая СМИ, банки, мероприятия, календарь, путешествия и погоду. Как отмечают авторы, это первый датасет, охватывающий такое количество областей и имеющий по нескольку API для каждой из них.

Подробно о SGD можно узнать в блоге Google. Исследовательская работа представлена на arXiv, исходный код доступен на GitHub.


Работа в ИТ в Беларуси​.​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​

1. Заполните анонимную форму — 5 минут.
2. Укажите зарплатные (и другие) ожидания.
3. Выберите желаемую индустрию или область деятельности.
4. Получайте релевантные предложения​​.​​​

Читайте также
CEO Anthropic: почти половина моей работы — культура компании, а не разработка ИИ
CEO Anthropic: почти половина моей работы — культура компании, а не разработка ИИ
CEO Anthropic: почти половина моей работы — культура компании, а не разработка ИИ
Южная Корея и Трамп хотят заставить бигтехи делиться сверхприбылями от ИИ с народом
Южная Корея и Трамп хотят заставить бигтехи делиться сверхприбылями от ИИ с народом
Южная Корея и Трамп хотят заставить бигтехи делиться сверхприбылями от ИИ с народом
1 комментарий
«Мы тратим слишком много»: компании учатся контролировать расходы на ИИ-токены
«Мы тратим слишком много»: компании учатся контролировать расходы на ИИ-токены
«Мы тратим слишком много»: компании учатся контролировать расходы на ИИ-токены
Стартап экономит $30 тысяч в месяц на лазейке в прайсинге OpenAI и Anthropic
Стартап экономит $30 тысяч в месяц на лазейке в прайсинге OpenAI и Anthropic
Стартап экономит $30 тысяч в месяц на лазейке в прайсинге OpenAI и Anthropic

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.