17% скидка на размещение рекламы на площадках devby — до 20 ноября. Клац!
Support us

Google обновила речевые сервисы для разработчиков

Оставить комментарий
Google обновила речевые сервисы для разработчиков

API для синтеза речи из текста и преобразования речи в текст сервиса Google Cloud сегодня получили ряд обновлений: поддержку большего числа языков, больший выбор голосов озвучки и улучшенные инструменты распознавания речи, пишет TechCrunch.

Прежде всего появилось 17 новых голосов в WaveNet — это звуковой движок Google на основе нейросети для генерации аудио из текста. Также голоса стали звучать более естественно.

Text-to-Speech API, доступ к которому теперь предоставляется всем пользователям, поддерживает 14 языков и предлагает 30 стандартных голосов и 26 голосов WaveNet. Послушать их бесплатно на любом отрывке текста можно здесь.

Ещё одно обновление — бета-версия аудиопрофилей. Их суть — оптимизировать аудиофайл под используемое для воспроизведения устройство, например, динамик телефона, наушники или колонки.

Что касается Speech-to-Text API, разработчикам станет проще транскрибировать записи с несколькими спикерами. Сервис на основе машинного обучения теперь может распознавать различных людей (хотя пользователю всё равно придётся сначала указать их количество на записи). Каждому слову он будет приписывать номер говорящего. Для стереофайлов с двумя участниками (например, сотрудник и клиент службы поддержки) Google будет разделять каналы и различать говорящих.

Разработчики смогут выбирать до 4 языков, а Speech-to-Text API автоматически определит, на каком них говорят люди.  Также в Speech-to-Text API вернули показатели степени уверенности при распознавании слов. Как отмечает Google, эту функцию можно использовать при создании приложений с упором на отдельные значимые слова.

Читайте также
Google придумала, как решить одну из главных проблем ИИ
Google придумала, как решить одну из главных проблем ИИ
Google придумала, как решить одну из главных проблем ИИ
Создатель «Всемирной паутины»: ИИ может разрушить рекламную модель интернета. А это — главный источник доходов Google и Meta
Создатель «Всемирной паутины»: ИИ может разрушить рекламную модель интернета. А это — главный источник доходов Google и Meta
Создатель «Всемирной паутины»: ИИ может разрушить рекламную модель интернета. А это — главный источник доходов Google и Meta
1 комментарий
Какие ниши в ИИ ещё не заняты — мнение инвестора
Какие ниши в ИИ ещё не заняты — мнение инвестора
Какие ниши в ИИ ещё не заняты — мнение инвестора
1 комментарий
Google снизит комиссии до 9% и откроет Android для всех — ради сделки с Epic
Google снизит комиссии до 9% и откроет Android для всех — ради сделки с Epic
Google снизит комиссии до 9% и откроет Android для всех — ради сделки с Epic

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.