Поиск работы стал еще удобнее: в Telegram появился чат-бот с вакансиями. Тестируйте 📲

Google открыла код ИИ-алгоритма, который распознаёт голоса с точностью 92%

Оставить комментарий
Google открыла код ИИ-алгоритма, который распознаёт голоса с точностью 92%

Исследователи Google AI опубликовали исходный код алгоритма для идентификации говорящих по их голосу, пишет VentureBeat.

Диаризация — процесс разделения потока речи на однородные сегменты в зависимости от принадлежности сказанного тому или иному говорящему, и этот процесс даётся непросто алгоритмам машинного обучения. Качественная система диаризации должна уметь соотносить с конкретными фрагментами речи новых людей, которых прежде не слышала.

В новой научной работе и соответствующей публикации в блоге компании исследователи из ИИ-подразделения Google описали новую интеллектуальную систему, которая способна более эффективно использовать маркированные данные по каждому спикеру при контролируемом обучении.

По словам авторов работы, ключевые алгоритмы достигают достаточно низкого коэффициента ошибок при распознавании дикторов онлайн: 7,6 процента на тестовом датасете для оценки качества таких систем NIST SRE 2000 CALLHOME — по сравнению с 8,8 процента у предыдущего метода Google.

Это позволяет использовать алгоритмы в приложениях, работающих в реальном времени. Их исходный код можно найти на GitHub.

Процесс диаризации аудиопотока. Каждый говорящий обозначен отдельным цветом.

Процесс диаризации аудиопотока. Каждый говорящий обозначен отдельным цветом.

Для моделирования «вставок» каждого спикера (математических представлений его слов и фраз) в новом подходе применяют рекуррентные нейросети, которые используют внутреннюю память для обработки последовательностей вводных данных. Нейросеть обновляется по мере поступления новых «вставок», что позволяет системе эффективно обучаться.

В будущем команда планирует усовершенствовать модель, чтобы она смогла интегрировать контекстуальную информацию для выполнения диаризации оффлайн — по мнению специалистов, это ещё больше снизит уровень ошибок.

«Мои цвета сменились темными».

История художницы, работы которой вы точно видели в Instagram.

btc
Bitcoin
btc
$29 886,00
-0,84%
eth
eth
$2 036,11
-2,23%
xrp
xrp
$0,42
-1,57%
ant
ant
$1,53
+3,24%
Читайте также
Число уязвимостей в продуктах Apple подскочило почти в 6 раз
Число уязвимостей в продуктах Apple подскочило почти в 6 раз
Число уязвимостей в продуктах Apple подскочило почти в 6 раз
У россиян больше не обновляется Google Chrome на Android
У россиян больше не обновляется Google Chrome на Android
У россиян больше не обновляется Google Chrome на Android
3 комментария
Google презентовала первые смарт-часы, AR-очки с мгновенным переводом речи, другое
Google презентовала первые смарт-часы, AR-очки с мгновенным переводом речи, другое
Google презентовала первые смарт-часы, AR-очки с мгновенным переводом речи, другое
Бигтех потерял более $1 трлн за три торговых дня
Бигтех потерял более $1 трлн за три торговых дня
Бигтех потерял более $1 трлн за три торговых дня
3 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментариев пока нет.
Спасибо! 

Получать рассылки dev.by про белорусское ИТ

Что-то пошло не так. Попробуйте позже