Мы запустили Dzik Pic Store. Заходи к нам в магазин за крутым мерчом ☃️
Support us

Нейросеть Microsoft имитирует голос по 3-секундному образцу

Microsoft представила модель искусственного интеллекта VALL-E, которая преобразует текст в речь, точно имитируя голос человека. Для образца достаточно записи длительностью всего 3 секунды. При этом ИИ сохраняет эмоциональную окраску речи образца, рассказывает 3DNews.

Оставить комментарий

Microsoft представила модель искусственного интеллекта VALL-E, которая преобразует текст в речь, точно имитируя голос человека. Для образца достаточно записи длительностью всего 3 секунды. При этом ИИ сохраняет эмоциональную окраску речи образца, рассказывает 3DNews.

При создании модели использовалась технология EnCodec от Meta, которая обеспечивает эффективное сжатие аудиосигнала. В отличие от традиционных методов преобразования текста в речь, VALL-E не конструирует звуковые волны, а анализирует особенности речи человека, разбивает эти данные на отдельные компоненты и генерирует запись на основе того, что уже «знает» об образце — моделирует голос, как он мог бы звучать за пределами образца. Модель обучали на библиотеке Meta LibriLight, которая построена на 60 тысячах часов англоязычной речи более 7 тысяч носителей.

Нейросеть может предложить несколько вариантов необходимого текста с голосом на образце. Причём она не только придаёт голосу на генерируемой записи нужный эмоциональный окрас, но и имитирует «акустическое окружение». Например, если исходная запись была сделана с телефонного разговора, то и результат будет напоминать разговор по телефону.

Авторы проекта говорят, что система будет полезна при разработке приложений для высококачественного преобразования текста в речь и при создании аудиоконтента в сочетании с другими ИИ-генераторами вроде GPT-3. Но также признают, что её можно использовать для редактирования аудиозаписи по расшифровке — модель может «заставить» человека произносить слова, которых он никогда в реальности не говорил. Из-за опасности злоупотреблений технологией Microsoft не раскрывает код VALL-E для экспериментов, поэтому все желающие протестировать её не смогут.

🎊 Dzik Pic Store открыт и готов принимать заказы!

Заходи к нам в магазин

Читайте также
Кризис нехватки оперативной памяти затянется на годы. Компании ищут выход
Кризис нехватки оперативной памяти затянется на годы. Компании ищут выход
Кризис нехватки оперативной памяти затянется на годы. Компании ищут выход
«AI усиливает конкуренцию, надо выделяться». Дата-инженер стал Databricks MVP — это поможет его карьере?
«AI усиливает конкуренцию, надо выделяться». Дата-инженер стал Databricks MVP — это поможет его карьере?
«AI усиливает конкуренцию, надо выделяться». Дата-инженер стал Databricks MVP — это поможет его карьере?
Беларус в Польше получил новый статус по программе компании Databricks — что это и какие преимущества даёт?
Аналитики: увольнения «из-за ИИ» — это фикция, которую компании придумали для маскировки проблем
Аналитики: увольнения «из-за ИИ» — это фикция, которую компании придумали для маскировки проблем
Аналитики: увольнения «из-за ИИ» — это фикция, которую компании придумали для маскировки проблем
Для появления сверхразумного ИИ не хватает лишь одной детали
Для появления сверхразумного ИИ не хватает лишь одной детали
Для появления сверхразумного ИИ не хватает лишь одной детали
3 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.