Support us

Google улучшила модели распознавания и синтеза речи и снизила цены

Оставить комментарий
Google улучшила модели распознавания и синтеза речи и снизила цены

Команда Google Cloud анонсировала ряд обновлений API для синтеза и понимания речи, которые помогут разработчикам строить более эффективные интеллектуальные голосовые приложения и охватить более широкую аудиторию, пишет ZDNet.

Google расширила API для синтеза речи Text-to-Speech — он получил новые языки и голоса. Кроме того, разработчики улучшили качество инструмента распознавания речи Speech-to-Text, а также открыла свободный доступ к некоторым его возможностям.

Text-to-Speech теперь поддерживает 7 новых языков: русский, польский, украинский, словацкий, норвежский, датский и португальский. Всего вместе с ними сервис насчитывает 21 язык. Помимо этого, Google добавила 31 голос генерирующей нейросети WaveNet и 24 стандартных голоса — всего их теперь 106.

Также Google открыла для всех функционал Device Profiles, который позволяет оптимизировать сгенерированное аудио для воспроизведения на различных типах устройств, например в наушниках.

Что касается транскрибатора Speech-to-Text, Google более чем на 60 процентов уменьшила количество ошибок в моделях распознавания речи в телефонных и видео-звонках. Бета-версии моделей вышли в прошлом году, а теперь они стали общедоступны. Также для всех открыт инструмент, который помогает API Speech-to-Text распознавать различные звуковые каналы. Это может пригодиться, например, в случае диалогов между несколькими людьми.

Наконец, Google на треть снизила стоимость сервиса Speech-to-Text для участников специальной программы, в рамках которой пользователи позволяют компании использовать свои данные для тренировки моделей.

Читайте также
ИТ-гиганты заставляют передовые нейросети разговаривать как неандертальцы, чтобы не обанкротиться
ИТ-гиганты заставляют передовые нейросети разговаривать как неандертальцы, чтобы не обанкротиться
ИТ-гиганты заставляют передовые нейросети разговаривать как неандертальцы, чтобы не обанкротиться
Разраб обошёл ограничения Apple и запустил обучение ИИ на чипах M4
Разраб обошёл ограничения Apple и запустил обучение ИИ на чипах M4
Разраб обошёл ограничения Apple и запустил обучение ИИ на чипах M4
Нейросети оказались дороже программистов? Техлид объясняет, почему спрос на разработчиков только вырастет
Нейросети оказались дороже программистов? Техлид объясняет, почему спрос на разработчиков только вырастет
Нейросети оказались дороже программистов? Техлид объясняет, почему спрос на разработчиков только вырастет
Просто удивительно: последние несколько лет нам все рассказывали, как нас заменит искусственный интеллект. И вот оказывается, что нет. Получается, нам врали? Выяснилось, что нейросеть — это не бесплатный программист, а дорогой инструмент, который далеко не всегда выгоднее человека.
7 комментариев
Сотрудники тратят почти день в неделю, чтобы «нянчиться» с ИИ, думают об увольнении
Сотрудники тратят почти день в неделю, чтобы «нянчиться» с ИИ, думают об увольнении
Сотрудники тратят почти день в неделю, чтобы «нянчиться» с ИИ, думают об увольнении
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.