Живешь в Польше? Подпишись на полезный канал о финансах Złoty Dzik
Support us

Новая ИИ-модель Microsoft создаёт 90-минутные подкасты из текста

Компания запустила новый открытый проект — VibeVoice, который превращает текст в реалистичную речь и способен генерировать полноценные подкасты длительностью до 90 минут.

Оставить комментарий
Новая ИИ-модель Microsoft создаёт 90-минутные подкасты из текста

Компания запустила новый открытый проект — VibeVoice, который превращает текст в реалистичную речь и способен генерировать полноценные подкасты длительностью до 90 минут.

В отличие от привычных решений на базе Copilot, VibeVoice сфокусирован исключительно на Text-to-Speech (TTS). Пользователь вводит текст, а модель преобразует его в аудиофайл с несколькими голосами, имитируя естественную беседу.

Система поддерживает до четырех разных «спикеров» и сохраняет естественные паузы и последовательность речи, что отличает ее от многих традиционных TTS-моделей.

Уже доступно две версии: с 1,5 миллиарда параметров (генерирует до 90 минут речи с контекстным окном 64k) и с 7 миллиардов параметров (ограничение до 45 минут при 32k контексте, но более высокое качество). В будущем появится облегченная версия на 0,5 миллиарда параметров, рассчитанная на потоковую генерацию в реальном времени.

Для локального запуска потребуется от 7 до 18 ГБ видеопамяти GPU, однако протестировать VibeVoice можно и онлайн, воспользовавшись веб-интерфейсом. Сейчас модель обучена только на английском и китайском языках, но разработчики планируют добавить новые. Исходный код можно найти на GitHub и Hugging Face.

Разработчики отмечают, что система умеет передавать эмоции и поддерживает многоголосие, но пока слабо справляется с пением. В дальнейшем планируется внедрить клонирование голосов. Помимо очевидных применений для подкастов и видеороликов, технология может стать ценным инструментом для образовательных сервисов.

Когда ИИ полностью заменит программистов? Учёные: очень нескоро
Когда ИИ полностью заменит программистов? Учёные: очень нескоро
По теме
Когда ИИ полностью заменит программистов? Учёные: очень нескоро
Бизнесмен придумал фейковый ИИ и обманул инвесторов на $45 млн
Бизнесмен придумал фейковый ИИ и обманул инвесторов на $4,5 млн
По теме
Бизнесмен придумал фейковый ИИ и обманул инвесторов на $4,5 млн
ИИ забирает работу у джунов — теперь это доказали учёные
ИИ забирает работу у джунов — теперь это доказали учёные
По теме
ИИ забирает работу у джунов — теперь это доказали учёные
Читайте также
Sony не может договориться с Microsoft о продлении выпуска Call of Duty на PlayStation
Sony не может договориться с Microsoft о продлении выпуска Call of Duty на PlayStation
Sony не может договориться с Microsoft о продлении выпуска Call of Duty на PlayStation
1 комментарий
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Microsoft запустила обучающий сайт по Java
Microsoft запустила обучающий сайт по Java
Microsoft запустила обучающий сайт по Java
1 комментарий
Google, Apple, Microsoft постепенно выносят производство из Китая
Google, Apple, Microsoft постепенно выносят производство из Китая
Google, Apple, Microsoft постепенно выносят производство из Китая
4 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.