Stability AI выпустила бесплатный ИИ-генератор звука

Компания опубликовала модель Stable Audio, которая генерирует музыку, звуковые эффекты и окружение. Модель и веса находятся на платформе Hugging Face.

Оставить комментарий

Stable Audio Open — открытая модель в формате Text-to-Audio, которая генерирует 47-секундные музыкальные семплы и звуковые эффекты. Например, нейросеть может создать партию для фортепиано, барабанный бит, гитарный риф, шум дождя и многое другое. Для генерации музыки необходим текстовый запрос. Создавать новую музыку можно и на основе данных пользователя.

В блоге компании указано, что бесплатная открытая модель отличается от одноименной коммерческой. Закрытая версия может генерировать трехминутные треки с проработанной структурой. Также коммерческая версия поддерживает режим Audio-to-Audio, в котором в качестве запроса можно передать уже готовый трек.

Разработчики обучали открытую модель на данных сервисов FreeSound и Free Music Archive: для этого нейросеть проанализировала около 486 тысяч сэмплов. Это позволило соблюсти все требования к авторским правам. При этом пользователи должны ознакомиться с лицензией на использование открытой нейросети.

«Концентрация власти в сфере ИИ вредит всем»: CEO Stability AI ушел в отставку
По теме
«Концентрация власти в сфере ИИ вредит всем»: CEO Stability AI ушел в отставку
Stability AI выпустила обновление ИИ-генератора Stable Diffusion
По теме
Stability AI выпустила обновление ИИ-генератора Stable Diffusion
Stability AI запустила генератор музыки по тексту
По теме
Stability AI запустила генератор музыки по тексту

Читать на dev.by