Support us

Google разработала высококачественную AI-систему для генерации речи

Оставить комментарий
Google разработала высококачественную AI-систему для генерации речи

Google создала высокомасштабируемую систему GAN-TTS  для преобразования текста в речь на базе генеративно-состязательной нейросети, которая превосходит другие современные системы, сообщает VentureBeat. 

По словам исследователей, модель отличается не только качеством и естественностью сгенерированной речи, высокой параллелизуемостью — то есть её проще тренировать на нескольких машинах. GAN-TTS состоит из свёрточной нейросети, которая обучена порождать аудио на корпусе с 567 лингвистическими и другими признаками, и 10 «дискриминаторов», которые пытаются определить подлинность фрагмента.

Возможности GAN-TTS проверили на 10 тысячах предложений. Сначала оценить естественность аудио предложили специалистам — им давали прослушать фрагменты речи длиной по 15 секунд. После этого результаты сравнивались с другой мощной моделью Google — WaveNet. Исследователи отдельно проводили количественную оценку производительности GAN-TTS по группе новых метрик.

По результатам, GAN-TTS оказалась в три раза эффективнее WaveNet (0,64 мегафлопс на сэмпл против 1,97 мегафлопс).

Подробно о GAN-TTS можно прочесть в работе, опубликованной на arXiv.

Читайте также
Google закроет сервис проверки утечек: юзеры не умеют им пользоваться
Google закроет сервис проверки утечек: юзеры не умеют им пользоваться
Google закроет сервис проверки утечек: юзеры не умеют им пользоваться
Три правила работы с чат-ботами — от инженера Google
Три правила работы с чат-ботами — от инженера Google
Три правила работы с чат-ботами — от инженера Google
Google Translate научился синхронно переводить живую речь
Google Translate научился синхронно переводить живую речь
Google Translate научился синхронно переводить живую речь
Google открыла разработчикам доступ к агенту Deep Research через API
Google открыла разработчикам доступ к агенту Deep Research через API
Google открыла разработчикам доступ к агенту Deep Research через API

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.