Дапамажыце dev.by 🤍
Падтрымаць

Google разработала высококачественную AI-систему для генерации речи

Пакінуць каментарый
Google разработала высококачественную AI-систему для генерации речи

Google создала высокомасштабируемую систему GAN-TTS  для преобразования текста в речь на базе генеративно-состязательной нейросети, которая превосходит другие современные системы, сообщает VentureBeat. 

По словам исследователей, модель отличается не только качеством и естественностью сгенерированной речи, высокой параллелизуемостью — то есть её проще тренировать на нескольких машинах. GAN-TTS состоит из свёрточной нейросети, которая обучена порождать аудио на корпусе с 567 лингвистическими и другими признаками, и 10 «дискриминаторов», которые пытаются определить подлинность фрагмента.

Возможности GAN-TTS проверили на 10 тысячах предложений. Сначала оценить естественность аудио предложили специалистам — им давали прослушать фрагменты речи длиной по 15 секунд. После этого результаты сравнивались с другой мощной моделью Google — WaveNet. Исследователи отдельно проводили количественную оценку производительности GAN-TTS по группе новых метрик.

По результатам, GAN-TTS оказалась в три раза эффективнее WaveNet (0,64 мегафлопс на сэмпл против 1,97 мегафлопс).

Подробно о GAN-TTS можно прочесть в работе, опубликованной на arXiv.

Чытайце таксама
У ЗША выйграна першая справа аб залежнасці ад сацсетак — Meta і Google пакараны за тое, як пабудаваны іх платформы
У ЗША выйграна першая справа аб залежнасці ад сацсетак — Meta і Google пакараны за тое, як пабудаваны іх платформы
У ЗША выйграна першая справа аб залежнасці ад сацсетак — Meta і Google пакараны за тое, як пабудаваны іх платформы
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Google запусціла ШІ-пошук Search Live па ўсім свеце, даступны на беларускай
Google запусціла ШІ-пошук Search Live па ўсім свеце, даступны на беларускай
Google запусціла ШІ-пошук Search Live па ўсім свеце, даступны на беларускай
Google прэзентавала Lyria 3 Pro: ШІ стварае 3-хвілінныя трэкі
Google прэзентавала Lyria 3 Pro: ШІ стварае 3-хвілінныя трэкі
Google прэзентавала Lyria 3 Pro: ШІ стварае 3-хвілінныя трэкі

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.