devby 17 лет! Вспоминаем переходный возраст и делимся виш-листом
Support us

Mozilla обновила систему распознавания речи DeepSpeech

Оставить комментарий
Mozilla обновила систему распознавания речи DeepSpeech

Mozilla представила обновление своей системы для распознавания речи. Версия DeepSpeech 0.6 является одной из самых быстрых опенсорсных моделей к сегодняшнему дню, пишет 3DNews.

В последней версии DeepSpeech интегрирована поддержка TensorFlow Lite — легковесной версии ML-библиотеки Google, оптимизированной под мобильные устройства. В результате размер DeepSpeech уменьшился с 98 Мб до 3,7 Мб, а размер готовой встроенной модели на английском языке — со 188 Мб до 47 Мб. Потребление памяти снизилось в 22 раза, а скорость запуска процесса обработки данных выросла более чем в 500 раз.

В целом DeepSpeech 0.6 стала значительно более производительной благодаря новому потоковому декодеру, который обеспечивает постоянно низкий уровень задержек и использования памяти независимо от длины транскрибируемого звука. Обе основные подсистемы платформы (акустическая модель и декодер) теперь поддерживают потоковую передачу, что избавляет разработчиков от необходимости тонкой настройки собственного оборудования. Обновлённая версия DeepSpeech способна обеспечить транскрипцию уже через 260 мс после окончания аудио — на 73% быстрее, чем до интеграции потокового декодера.

Что касается производительности, в новой версии системы в два раза сократились сроки обучения моделей. Этого удалось добиться благодаря использованию системы TensorFlow 1.14 и интеграции новых API.

Для обучения модели используется набор голосовых данных Common Voice, состоящий из 1400 часов речи на 18 разных языках. Разработчики отмечают, что это один из самых крупных многоязычных наборов голосовых данных. В настоящее время компания ведёт активную работу по сбору данных на 70 языках, чтобы ещё больше усовершенствовать DeepSpeech.


Работа в ИТ в Беларуси​.​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​ ​

1. Заполните анонимную форму — 5 минут.
2. Укажите зарплатные (и другие) ожидания.
3. Выберите желаемую индустрию или область деятельности.
4. Получайте релевантные предложения​​.​​

Читайте также
Главные технические навыки, которые стоит освоить в 2025 году
Главные технические навыки, которые стоит освоить в 2025 году
Главные технические навыки, которые стоит освоить в 2025 году
2 комментария
Mozilla сократила треть штата
Mozilla сократила треть штата
Mozilla сократила треть штата
2 комментария
На Mozilla подали жалобу за трекинг пользователей через Firefox
На Mozilla подали жалобу за трекинг пользователей через Firefox
На Mozilla подали жалобу за трекинг пользователей через Firefox
1 комментарий
Google признали монополистом на рынке поиска. Что это значит?
Google признали монополистом на рынке поиска. Что это значит?
Google признали монополистом на рынке поиска. Что это значит?
Впервые за 25 лет американский суд признал технологическую корпорацию монополистом, но еще не определился с наказанием. Как решение отразится на корпорации и пользователях?
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.