🧑‍🎓 Бакалавриат, магистратура, MBA в Польше — подробный гайд
Support us

Google обновила речевые сервисы для разработчиков

Оставить комментарий
Google обновила речевые сервисы для разработчиков

API для синтеза речи из текста и преобразования речи в текст сервиса Google Cloud сегодня получили ряд обновлений: поддержку большего числа языков, больший выбор голосов озвучки и улучшенные инструменты распознавания речи, пишет TechCrunch.

Прежде всего появилось 17 новых голосов в WaveNet — это звуковой движок Google на основе нейросети для генерации аудио из текста. Также голоса стали звучать более естественно.

Text-to-Speech API, доступ к которому теперь предоставляется всем пользователям, поддерживает 14 языков и предлагает 30 стандартных голосов и 26 голосов WaveNet. Послушать их бесплатно на любом отрывке текста можно здесь.

Ещё одно обновление — бета-версия аудиопрофилей. Их суть — оптимизировать аудиофайл под используемое для воспроизведения устройство, например, динамик телефона, наушники или колонки.

Что касается Speech-to-Text API, разработчикам станет проще транскрибировать записи с несколькими спикерами. Сервис на основе машинного обучения теперь может распознавать различных людей (хотя пользователю всё равно придётся сначала указать их количество на записи). Каждому слову он будет приписывать номер говорящего. Для стереофайлов с двумя участниками (например, сотрудник и клиент службы поддержки) Google будет разделять каналы и различать говорящих.

Разработчики смогут выбирать до 4 языков, а Speech-to-Text API автоматически определит, на каком них говорят люди.  Также в Speech-to-Text API вернули показатели степени уверенности при распознавании слов. Как отмечает Google, эту функцию можно использовать при создании приложений с упором на отдельные значимые слова.

Читайте также
Google готовит новый формат техсобесов — инженерам разрешат ИИ и будут проверять умение работать с ним
Google готовит новый формат техсобесов — инженерам разрешат ИИ и будут проверять умение работать с ним
Google готовит новый формат техсобесов — инженерам разрешат ИИ и будут проверять умение работать с ним
OpenAI выпустила расширения ChatGPT для Excel и «Google Таблиц», доступны всем
OpenAI выпустила расширения ChatGPT для Excel и «Google Таблиц», доступны всем
OpenAI выпустила расширения ChatGPT для Excel и «Google Таблиц», доступны всем
Как завалить собес в польский Google: личный опыт беларуса, который дошёл до финала
Как завалить собес в польский Google: личный опыт беларуса, который дошёл до финала
Как завалить собес в польский Google: личный опыт беларуса, который дошёл до финала
Читатель канала DzikPic рассказывает про факап. 
23 комментария
Meta, Google и OpenAI теряют топовых ИИ-исследователей — они уходят и сразу поднимают миллиарды
Meta, Google и OpenAI теряют топовых ИИ-исследователей — они уходят и сразу поднимают миллиарды
Meta, Google и OpenAI теряют топовых ИИ-исследователей — они уходят и сразу поднимают миллиарды

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.