Реклама в Telegram-каналах DzikPic и dev.by теперь дешевле. Узнать подробности 👨🏻‍💻
Support us

Mozilla обновила систему распознавания речи DeepSpeech

Оставить комментарий
Mozilla обновила систему распознавания речи DeepSpeech

Mozilla представила обновление своей системы для распознавания речи. Версия DeepSpeech 0.6 является одной из самых быстрых опенсорсных моделей к сегодняшнему дню, пишет 3DNews.

В последней версии DeepSpeech интегрирована поддержка TensorFlow Lite — легковесной версии ML-библиотеки Google, оптимизированной под мобильные устройства. В результате размер DeepSpeech уменьшился с 98 Мб до 3,7 Мб, а размер готовой встроенной модели на английском языке — со 188 Мб до 47 Мб. Потребление памяти снизилось в 22 раза, а скорость запуска процесса обработки данных выросла более чем в 500 раз.

В целом DeepSpeech 0.6 стала значительно более производительной благодаря новому потоковому декодеру, который обеспечивает постоянно низкий уровень задержек и использования памяти независимо от длины транскрибируемого звука. Обе основные подсистемы платформы (акустическая модель и декодер) теперь поддерживают потоковую передачу, что избавляет разработчиков от необходимости тонкой настройки собственного оборудования. Обновлённая версия DeepSpeech способна обеспечить транскрипцию уже через 260 мс после окончания аудио — на 73% быстрее, чем до интеграции потокового декодера.

Что касается производительности, в новой версии системы в два раза сократились сроки обучения моделей. Этого удалось добиться благодаря использованию системы TensorFlow 1.14 и интеграции новых API.

Для обучения модели используется набор голосовых данных Common Voice, состоящий из 1400 часов речи на 18 разных языках. Разработчики отмечают, что это один из самых крупных многоязычных наборов голосовых данных. В настоящее время компания ведёт активную работу по сбору данных на 70 языках, чтобы ещё больше усовершенствовать DeepSpeech.


Работа в ИТ в Беларуси​.​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​ ​

1. Заполните анонимную форму — 5 минут.
2. Укажите зарплатные (и другие) ожидания.
3. Выберите желаемую индустрию или область деятельности.
4. Получайте релевантные предложения​​.​​

Новый рекламный формат в наших телеграм-каналах.

Купить 500 символов за $150

Читайте также
Flo ответила на критику Mozilla о защите приватности
Flo ответила на критику Mozilla о защите приватности
Flo ответила на критику Mozilla о защите приватности
2 комментария
Mozilla отчитала Flo за беспорядок в политике приватности и обвинила в обмане пользовательниц
Mozilla отчитала Flo за беспорядок в политике приватности и обвинила в обмане пользовательниц
Mozilla отчитала Flo за беспорядок в политике приватности и обвинила в обмане пользовательниц
1 комментарий
«Ты был вишенкой на торте»: Mozilla прислала Microsoft торт по случаю «смерти» Internet Explorer
«Ты был вишенкой на торте»: Mozilla прислала Microsoft торт по случаю «смерти» Internet Explorer
«Ты был вишенкой на торте»: Mozilla прислала Microsoft торт по случаю «смерти» Internet Explorer
«Яндекс» выложил YaLM 100B — крупнейшую нейросеть для порождения текста в открытом доступе
«Яндекс» выложил YaLM 100B — крупнейшую нейросеть для порождения текста в открытом доступе
«Яндекс» выложил YaLM 100B — крупнейшую нейросеть для порождения текста в открытом доступе

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.