Айцішнік напісаў першы беларускамоўны посткіберпанк-раман. Пра што?
Support us

Новая ИИ-модель Microsoft создаёт 90-минутные подкасты из текста

Компания запустила новый открытый проект — VibeVoice, который превращает текст в реалистичную речь и способен генерировать полноценные подкасты длительностью до 90 минут.

Оставить комментарий
Новая ИИ-модель Microsoft создаёт 90-минутные подкасты из текста

Компания запустила новый открытый проект — VibeVoice, который превращает текст в реалистичную речь и способен генерировать полноценные подкасты длительностью до 90 минут.

В отличие от привычных решений на базе Copilot, VibeVoice сфокусирован исключительно на Text-to-Speech (TTS). Пользователь вводит текст, а модель преобразует его в аудиофайл с несколькими голосами, имитируя естественную беседу.

Система поддерживает до четырех разных «спикеров» и сохраняет естественные паузы и последовательность речи, что отличает ее от многих традиционных TTS-моделей.

Уже доступно две версии: с 1,5 миллиарда параметров (генерирует до 90 минут речи с контекстным окном 64k) и с 7 миллиардов параметров (ограничение до 45 минут при 32k контексте, но более высокое качество). В будущем появится облегченная версия на 0,5 миллиарда параметров, рассчитанная на потоковую генерацию в реальном времени.

Для локального запуска потребуется от 7 до 18 ГБ видеопамяти GPU, однако протестировать VibeVoice можно и онлайн, воспользовавшись веб-интерфейсом. Сейчас модель обучена только на английском и китайском языках, но разработчики планируют добавить новые. Исходный код можно найти на GitHub и Hugging Face.

Разработчики отмечают, что система умеет передавать эмоции и поддерживает многоголосие, но пока слабо справляется с пением. В дальнейшем планируется внедрить клонирование голосов. Помимо очевидных применений для подкастов и видеороликов, технология может стать ценным инструментом для образовательных сервисов.

Когда ИИ полностью заменит программистов? Учёные: очень нескоро
Когда ИИ полностью заменит программистов? Учёные: очень нескоро
По теме
Когда ИИ полностью заменит программистов? Учёные: очень нескоро
Бизнесмен придумал фейковый ИИ и обманул инвесторов на $45 млн
Бизнесмен придумал фейковый ИИ и обманул инвесторов на $4,5 млн
По теме
Бизнесмен придумал фейковый ИИ и обманул инвесторов на $4,5 млн
ИИ забирает работу у джунов — теперь это доказали учёные
ИИ забирает работу у джунов — теперь это доказали учёные
По теме
ИИ забирает работу у джунов — теперь это доказали учёные
Читайте также
Три года с ChatGPT. Как исскуственный интеллект стал моим стилистом, терапевтом и преподавателем
Три года с ChatGPT. Как исскуственный интеллект стал моим стилистом, терапевтом и преподавателем
Три года с ChatGPT. Как исскуственный интеллект стал моим стилистом, терапевтом и преподавателем
Вот уже три года я каждый день общаюсь с ChatGPT. Он стал незаменимым помощником в изучении языка и даже помог сформировать собственный стиль в одежде. Кажется, из бездушного робота превратился в близкого спутника. В этой колонке я делюсь своим опытом использования ChatGPT в повседневных задачах и рассказываю, как искусственный интеллект помогает мне экономить время и энергию.
Вы напугали OpenAI: Альтман сказал сотрудникам, что свежие релизы Google могут создать проблемы для стартапа
Вы напугали OpenAI: Альтман сказал сотрудникам, что свежие релизы Google могут создать проблемы для стартапа
Вы напугали OpenAI: Альтман сказал сотрудникам, что свежие релизы Google могут создать проблемы для стартапа
Глава Google DeepMind: будущее ИИ — за «мировыми моделями»
Глава Google DeepMind: будущее ИИ — за «мировыми моделями»
Глава Google DeepMind: будущее ИИ — за «мировыми моделями»
Microsoft признала, что почти все основные компоненты Windows 11 поломаны
Microsoft признала, что почти все основные компоненты Windows 11 поломаны
Microsoft признала, что почти все основные компоненты Windows 11 поломаны
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.