Дапамажыце dev.by 🤍
Падтрымаць

Baidu научила систему распознавания голоса имитировать сотни акцентов

Пакінуць каментарый
Baidu научила систему распознавания голоса имитировать сотни акцентов

Китайская Baidu представила Deep Voice 2 — систему распознавания голоса, которая способна «выучить» нюансы произношения человека на основании всего лишь получаса тренировочного аудио, сообщает The Verge.

Читать далее

Фото: The Verge

Deep Voice 2 удалось достигнуть впечатляющих показателей благодаря использованию подхода, отличного от общепринятого: система изучает общие черты, характерные для сотен различных людей, строит «общую» модель человеческого голоса и затем «дорабатывает» её для имитации конкретного произношения. При этом система не требует ручной настройки.

По мнению Baidu, технология будет полезна при работе домашних помощников, использующих голосовое общение с пользователями. Возможно и применение в разработке электронных и аудиокниг.

«Умение быстро синтезировать разнообразные человеческие голоса окажет большое влияние на личных помощников и производство электронных книг в будущем. Например, каждый герой аудиокниги сможет получить свой уникальный голос», — рассказывают представители Baidu в блоге компании.

На рынке распознавания и имитации голоса достаточно плотная конкуренция. В «гонке вооружений» участвуют и крупные компании, и стартапы. Так, подразделение Google DeepMind в сентябре 2016 года опубликовало исследование голосовому кодеку WaveNet, созданному с использованием техник глубинного обучения. А в апреле 2017-го канадский стартап Lyrebird представил систему, способную имитировать голосовые особенности известных людей на основе одной минуты входящих аудиоданных.

Чытайце таксама
ШІ генеруе «працоўнае смецце», якое псуе прадуктыўнасць і адносіны паміж калегамі
ШІ генеруе «працоўнае смецце», якое псуе прадуктыўнасць і адносіны паміж калегамі
ШІ генеруе «працоўнае смецце», якое псуе прадуктыўнасць і адносіны паміж калегамі
Чат-боты сталі даваць удвая больш ілжывых адказаў, чым год таму
Чат-боты сталі даваць удвая больш ілжывых адказаў, чым год таму
Чат-боты сталі даваць удвая больш ілжывых адказаў, чым год таму
ШІ запавольвае дасведчаных распрацоўшчыкаў — цяпер афіцыйна
ШІ запавольвае дасведчаных распрацоўшчыкаў — цяпер афіцыйна
ШІ запавольвае дасведчаных распрацоўшчыкаў — цяпер афіцыйна
6 каментарыяў
Бясконцы працоўны дзень: Microsoft кажа, што овертаймы робяцца нормай
Бясконцы працоўны дзень: Microsoft кажа, што овертаймы робяцца нормай
Бясконцы працоўны дзень: Microsoft кажа, што овертаймы робяцца нормай
3 каментарыя

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.