Support us

Baidu научила искусственный интеллект изменять пол и акцент в речи человека

Оставить комментарий
Baidu научила искусственный интеллект изменять пол и акцент в речи человека

Синтезатор речи китайского ИИ-титана Baidu теперь может не только точно и быстро имитировать человека, но и, к примеру, преобразовать голос британца в голос американки, пишет The Next Web.

Читать далее

Фото: The Next Web

В прошлом году команда Deep Voice представила новый алгоритм, который научился клонировать человеческий голос на основе 30-минутного материала. С того времени исследователи значительно продвинулись вперёд: новой системе для этого достаточно аудио продолжительностью всего несколько секунд.

Также алгоритм умеет воспроизводить голос, превращать мужской голос в женский, а также изменять британский акцент на американский. Примеры можно послушать на Github проекта.

Команда опубликовала два различных механизма обучения, которые используют в процессе. В первом случае голос звучит более естественно, но алгоритм требует больше вводных данных, а вторая модель способна генерировать аудио быстрее, но при более низком качестве. И оба они быстрее предыдущей версии Deep Voice. Учёные планирует продолжить совершенствование алгоритмов и обучать на более массивном наборе данных.

Цель исследователей — продемонстрировать, что машины, как и люди, могут обучаться сложным задачам на ограниченном количестве примеров. При этом имитация голоса — лишь один из вариантов применения искусственного интеллекта. Учёным важно найти способ расширить его возможности и при этом снизить затрачиваемые вычислительные мощности.

Место солидарности беларусского ИТ-комьюнити

Далучайся!

Читайте также
TinyML, No-code и обучение с подкреплением: новейшие тренды в машинном обучении
TinyML, No-code и обучение с подкреплением: новейшие тренды в машинном обучении
TinyML, No-code и обучение с подкреплением: новейшие тренды в машинном обучении
Пока 20% топ-менеджеров утверждают, что машинное обучение является существенной частью их бизнеса, неудивительно, что стоимость мирового рынка машинного обучения, по некоторым оценкам, достигнет $117 млрд к концу 2027 года. Мы перевели материал Udacity о семи самых обсуждаемых тенденциях в машинном обучении в 2022 году.
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
3 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.