OpenAI представила модель для преобразования текста в голос пользователя

OpenAI создала ИИ-синтезатор Voice Engine, который озвучивает текстовые запросы голосом пользователя. О нём компания рассказала в блоге, там же выложены примеры аудиофрагментов.

Оставить комментарий

Генератору нужна запись голоса пользователя (или любого другого человека) длиной всего 15 секунд. На основе неё Voice Engine создаёт крайне реалистично звучащую копию голоса, которым можно озвучить любой текст, в том числе на языке, которым его обладатель не владеет.

Voice Engine был разработан в конце 2022 года и находится на этапе раннего тестирования среди небольшой группы партнёров OpenAI. Компания пока не решила, открывать ли доступ к нему широкой публике и каким образом — разработчики понимают, что технология может нести опасность для общества. Сейчас он применяется в голосовых функциях ChatGPT и фирменных API для преобразования текста в речь.

Claude 3 вытеснила GPT-4 с вершины рейтинга языковых моделей
По теме
Claude 3 вытеснила GPT-4 с вершины рейтинга языковых моделей
Маркетплейс OpenAI заполонили боты, нарушающие авторское право
По теме
Маркетплейс OpenAI заполонили боты, нарушающие авторское право
Сотрудники Microsoft опасаются, что она становится ИТ-придатком OpenAI
По теме
Сотрудники Microsoft опасаются, что она становится ИТ-придатком OpenAI

Читать на dev.by