🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

Amazon выпустит крупнейший разговорный датасет на 4 млн слов

Оставить комментарий
Amazon выпустит крупнейший разговорный датасет на 4 млн слов

Amazon собирается открыть публичный доступ к огромному количеству фрагментов речи для исследований по обработке естественного языка, пишет VentureBeat.

Собранный краудсорсерами датасет под названием Topical Chat планируется выпустить в этом сентябре. Этот набор бесед между людьми был разработан для участников ежегодного конкурса Alexa Prize Socialbot Grand Challenge. Им предоставляется расширенная версия датасета, которая включает новейшие добавления в корпусе и аннотации.

Датасет будет включать более 210 тысяч высказываний, или 4,1 млн слов. По словам Amazon, он станет крупнейшим набором диалогов и знаний, открытым для исследовательского сообщества.

Каждая из бесед или реплик с ответами привязана к знаниям, которые предоставлялись краудсорсерам, и ссылается к соответствующему набору объектов. Компания отмечает, что никакие из собранных краудсорсерами фрагментов речи не принадлежат пользователям голосового ассистента Amazon Alexa.

Датасета Topical Chat призван способствовать высококачественным исследованиям нейронных ответных систем (ботов) на основе знаний и решать проблемы обработки естественных бесед, которые не решают другие свободные датасеты. Это позволит исследователям сосредоточиться на том, как люди сменяют темы в разговоре, выборе знаний и интеграции фактов и мнений в диалог.

Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Бывший вице-президент Amazon: повышение получает тот, кого слышно
Бывший вице-президент Amazon: повышение получает тот, кого слышно
Бывший вице-президент Amazon: повышение получает тот, кого слышно
Техлид Amazon продвинулась благодаря ИИ. Вот её три совета по вайб-кодингу
Техлид Amazon продвинулась благодаря ИИ. Вот её три совета по вайб-кодингу
Техлид Amazon продвинулась благодаря ИИ. Вот её три совета по вайб-кодингу
Сотрудники Amazon жалуются, что ИИ только увеличивает нагрузку. Огромное исследование подтверждает их выводы
Сотрудники Amazon жалуются, что ИИ только увеличивает нагрузку. Огромное исследование подтверждает их выводы
Сотрудники Amazon жалуются, что ИИ только увеличивает нагрузку. Огромное исследование подтверждает их выводы
Все правки кода от ИИ в Amazon теперь должны согласовываться с опытными инженерами, чтобы больше не ронять сервисы на часы
Все правки кода от ИИ в Amazon теперь должны согласовываться с опытными инженерами, чтобы больше не ронять сервисы на часы
Все правки кода от ИИ в Amazon теперь должны согласовываться с опытными инженерами, чтобы больше не ронять сервисы на часы

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.