📸 8 залов для съёмки контента в Варшаве — от циклорамы до подкастной
Support us

Новая ИИ-модель Microsoft создаёт 90-минутные подкасты из текста

Компания запустила новый открытый проект — VibeVoice, который превращает текст в реалистичную речь и способен генерировать полноценные подкасты длительностью до 90 минут.

Оставить комментарий
Новая ИИ-модель Microsoft создаёт 90-минутные подкасты из текста

Компания запустила новый открытый проект — VibeVoice, который превращает текст в реалистичную речь и способен генерировать полноценные подкасты длительностью до 90 минут.

В отличие от привычных решений на базе Copilot, VibeVoice сфокусирован исключительно на Text-to-Speech (TTS). Пользователь вводит текст, а модель преобразует его в аудиофайл с несколькими голосами, имитируя естественную беседу.

Система поддерживает до четырех разных «спикеров» и сохраняет естественные паузы и последовательность речи, что отличает ее от многих традиционных TTS-моделей.

Уже доступно две версии: с 1,5 миллиарда параметров (генерирует до 90 минут речи с контекстным окном 64k) и с 7 миллиардов параметров (ограничение до 45 минут при 32k контексте, но более высокое качество). В будущем появится облегченная версия на 0,5 миллиарда параметров, рассчитанная на потоковую генерацию в реальном времени.

Для локального запуска потребуется от 7 до 18 ГБ видеопамяти GPU, однако протестировать VibeVoice можно и онлайн, воспользовавшись веб-интерфейсом. Сейчас модель обучена только на английском и китайском языках, но разработчики планируют добавить новые. Исходный код можно найти на GitHub и Hugging Face.

Разработчики отмечают, что система умеет передавать эмоции и поддерживает многоголосие, но пока слабо справляется с пением. В дальнейшем планируется внедрить клонирование голосов. Помимо очевидных применений для подкастов и видеороликов, технология может стать ценным инструментом для образовательных сервисов.

Когда ИИ полностью заменит программистов? Учёные: очень нескоро
Когда ИИ полностью заменит программистов? Учёные: очень нескоро
По теме
Когда ИИ полностью заменит программистов? Учёные: очень нескоро
Бизнесмен придумал фейковый ИИ и обманул инвесторов на $45 млн
Бизнесмен придумал фейковый ИИ и обманул инвесторов на $4,5 млн
По теме
Бизнесмен придумал фейковый ИИ и обманул инвесторов на $4,5 млн
ИИ забирает работу у джунов — теперь это доказали учёные
ИИ забирает работу у джунов — теперь это доказали учёные
По теме
ИИ забирает работу у джунов — теперь это доказали учёные
Читайте также
ИИ-интерфейс помог пациенту с БАС говорить и вернуться к работе
ИИ-интерфейс помог пациенту с БАС говорить и вернуться к работе
ИИ-интерфейс помог пациенту с БАС говорить и вернуться к работе
«Это даёт невероятную свободу»: у CEO Anthropic всего один прямой подчиненный
«Это даёт невероятную свободу»: у CEO Anthropic всего один прямой подчиненный
«Это даёт невероятную свободу»: у CEO Anthropic всего один прямой подчиненный
«ИИ не заменит колледж»: мнение «крестной матери Кремниевой долины»
«ИИ не заменит колледж»: мнение «крестной матери Кремниевой долины»
«ИИ не заменит колледж»: мнение «крестной матери Кремниевой долины»
Глава Accenture просит инвесторов подождать, пока бизнес адаптируется к ИИ. Котировки между тем рухнули вдвое
Глава Accenture просит инвесторов подождать, пока бизнес адаптируется к ИИ. Котировки между тем рухнули вдвое
Глава Accenture просит инвесторов подождать, пока бизнес адаптируется к ИИ. Котировки между тем рухнули вдвое

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.