Живете в Польше? Поддержите devby 1,5% налога: бесплатно и за 5 минут 🤗
Support us

Google обновила речевые сервисы для разработчиков

Оставить комментарий
Google обновила речевые сервисы для разработчиков

API для синтеза речи из текста и преобразования речи в текст сервиса Google Cloud сегодня получили ряд обновлений: поддержку большего числа языков, больший выбор голосов озвучки и улучшенные инструменты распознавания речи, пишет TechCrunch.

Прежде всего появилось 17 новых голосов в WaveNet — это звуковой движок Google на основе нейросети для генерации аудио из текста. Также голоса стали звучать более естественно.

Text-to-Speech API, доступ к которому теперь предоставляется всем пользователям, поддерживает 14 языков и предлагает 30 стандартных голосов и 26 голосов WaveNet. Послушать их бесплатно на любом отрывке текста можно здесь.

Ещё одно обновление — бета-версия аудиопрофилей. Их суть — оптимизировать аудиофайл под используемое для воспроизведения устройство, например, динамик телефона, наушники или колонки.

Что касается Speech-to-Text API, разработчикам станет проще транскрибировать записи с несколькими спикерами. Сервис на основе машинного обучения теперь может распознавать различных людей (хотя пользователю всё равно придётся сначала указать их количество на записи). Каждому слову он будет приписывать номер говорящего. Для стереофайлов с двумя участниками (например, сотрудник и клиент службы поддержки) Google будет разделять каналы и различать говорящих.

Разработчики смогут выбирать до 4 языков, а Speech-to-Text API автоматически определит, на каком них говорят люди.  Также в Speech-to-Text API вернули показатели степени уверенности при распознавании слов. Как отмечает Google, эту функцию можно использовать при создании приложений с упором на отдельные значимые слова.

🎊 Dzik Pic Store открыт и готов принимать заказы!

Заходи к нам в магазин

Читайте также
Google обвалила акции игровых студий
Google обвалила акции игровых студий
Google обвалила акции игровых студий
2 комментария
Google открыла доступ к Project Genie — генератору виртуальных миров
Google открыла доступ к Project Genie — генератору виртуальных миров
Google открыла доступ к Project Genie — генератору виртуальных миров
Сотрудники Google требуют защитить их от миграционных агентов США
Сотрудники Google требуют защитить их от миграционных агентов США
Сотрудники Google требуют защитить их от миграционных агентов США
1 комментарий
Google представила ИИ для прогнозирования рака и других генетических заболеваний
Google представила ИИ для прогнозирования рака и других генетических заболеваний
Google представила ИИ для прогнозирования рака и других генетических заболеваний

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.