Дапамажыце dev.by 🤍
Падтрымаць

Google обновила речевые сервисы для разработчиков

Пакінуць каментарый
Google обновила речевые сервисы для разработчиков

API для синтеза речи из текста и преобразования речи в текст сервиса Google Cloud сегодня получили ряд обновлений: поддержку большего числа языков, больший выбор голосов озвучки и улучшенные инструменты распознавания речи, пишет TechCrunch.

Прежде всего появилось 17 новых голосов в WaveNet — это звуковой движок Google на основе нейросети для генерации аудио из текста. Также голоса стали звучать более естественно.

Text-to-Speech API, доступ к которому теперь предоставляется всем пользователям, поддерживает 14 языков и предлагает 30 стандартных голосов и 26 голосов WaveNet. Послушать их бесплатно на любом отрывке текста можно здесь.

Ещё одно обновление — бета-версия аудиопрофилей. Их суть — оптимизировать аудиофайл под используемое для воспроизведения устройство, например, динамик телефона, наушники или колонки.

Что касается Speech-to-Text API, разработчикам станет проще транскрибировать записи с несколькими спикерами. Сервис на основе машинного обучения теперь может распознавать различных людей (хотя пользователю всё равно придётся сначала указать их количество на записи). Каждому слову он будет приписывать номер говорящего. Для стереофайлов с двумя участниками (например, сотрудник и клиент службы поддержки) Google будет разделять каналы и различать говорящих.

Разработчики смогут выбирать до 4 языков, а Speech-to-Text API автоматически определит, на каком них говорят люди.  Также в Speech-to-Text API вернули показатели степени уверенности при распознавании слов. Как отмечает Google, эту функцию можно использовать при создании приложений с упором на отдельные значимые слова.

Чытайце таксама
Google абрынула акцыі гульнявых студый
Google абрынула акцыі гульнявых студый
Google абрынула акцыі гульнявых студый
2 каментарыя
Google адкрыла доступ да Project Genie — генератара віртуальных светаў
Google адкрыла доступ да Project Genie — генератара віртуальных светаў
Google адкрыла доступ да Project Genie — генератара віртуальных светаў
Супрацоўнікі Google патрабуюць абароны ад міграцыйных агентаў ЗША
Супрацоўнікі Google патрабуюць абароны ад міграцыйных агентаў ЗША
Супрацоўнікі Google патрабуюць абароны ад міграцыйных агентаў ЗША
1 каментарый
Без шостага пальца: Gemini навучылася аналізаваць выявы па кроках
Без шостага пальца: Gemini навучылася аналізаваць выявы па кроках
Без шостага пальца: Gemini навучылася аналізаваць выявы па кроках

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.