Дапамажыце dev.by 🤍
Падтрымаць

Amazon открыла речевой датасет Topical Chat

Пакінуць каментарый
Amazon открыла речевой датасет Topical Chat

В апреле Amazon пообещала открыть свободный доступ к собранному краудсорсерами набору фрагментов речи для обучения алгоритмов по обработке естественного языка. Компания опубликовала исходный код датасета Topical Chat на GitHub, пишет VentureBeat.

Датасет, изначально готовившийся для участников конкурса Alexa Prize Socialbot Grand Challenge, включает более 235 тысяч высказываний и свыше 4,7 млн слов, на основе которых можно создавать высококачественные, воспроизводимые диалоговые системы поиска.

Датасет призван способствовать инновационных исследований в области нейросетевых вопросно-ответных систем. По словам Amazon, он решает многие проблемы, которые не закрывают другие аналогичные датасеты, например, переход между темами естественным для человека образом, выбор и расширение знаний, интеграция фактов и мнений в диалог.

Для датасета было отобрано 300 объектов (люди, места или предметы) по 8 категориям, наиболее часто встречающимся в диалогах с ботами, разработанными в рамках Alexa Prize. Объекты были сгруппированы на основе их совместного употребления в информационных источниках, и для каждого объекта в таком кластере собирались дополнительные источники. Данные были обработаны в парах сотрудниками Amazon Mechanical Turk, после чего генерируемые диалоги прошли ручную и автоматизированную проверку.

Чытайце таксама
Тэхлід Amazon прасунулася дзякуючы ШІ. Вось яе тры парады па вайб-кодынгу
Тэхлід Amazon прасунулася дзякуючы ШІ. Вось яе тры парады па вайб-кодынгу
Тэхлід Amazon прасунулася дзякуючы ШІ. Вось яе тры парады па вайб-кодынгу
Супрацоўнікі Amazon скардзяцца, што ШІ толькі павялічвае нагрузку. Вялікае даследаванне пацвярджае іх высновы
Супрацоўнікі Amazon скардзяцца, што ШІ толькі павялічвае нагрузку. Вялікае даследаванне пацвярджае іх высновы
Супрацоўнікі Amazon скардзяцца, што ШІ толькі павялічвае нагрузку. Вялікае даследаванне пацвярджае іх высновы
Усе праўкі кода ад ШІ ў Amazon цяпер павінны ўзгадняцца з дасведчанымі інжынерамі, каб больш не ламаць сэрвісы на гадзіны
Усе праўкі кода ад ШІ ў Amazon цяпер павінны ўзгадняцца з дасведчанымі інжынерамі, каб больш не ламаць сэрвісы на гадзіны
Усе праўкі кода ад ШІ ў Amazon цяпер павінны ўзгадняцца з дасведчанымі інжынерамі, каб больш не ламаць сэрвісы на гадзіны
Nvidia і Amazon закрылі офісы ў Дубаі, супрацоўнікі Google не могуць пакінуць рэгіён
Nvidia і Amazon закрылі офісы ў Дубаі, супрацоўнікі Google не могуць пакінуць рэгіён
Nvidia і Amazon закрылі офісы ў Дубаі, супрацоўнікі Google не могуць пакінуць рэгіён
2 каментарыя

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.