Meta представила аудиокодек, который сжимает 10-кратно по сравнению с MP3
Компания представила кодек на основе искусственного интеллекта, который сжимает аудио в десять раз без потери качества.
Компания представила кодек на основе искусственного интеллекта, который сжимает аудио в десять раз без потери качества.
Encodec может сжать поток данным MP3 со скоростью 64 Кбит/с в 6 Кбит/с при сохранении того же качества. Кодек может кодировать и декодировать аудиоданные в режиме реального времени на одном ядре ЦП без ущерба для процесса. По словам представителей компании, этот метод может значительно улучшить качество звука при низкоскоростных соединениях, например, при телефонных звонках с нестабильным соединением.
Трехступенчатая система Encodec начинается с преобразования несжатых данных в специальный формат с более низким битрейтом. Далее алгоритм сжимает полученный формат до необходимого размера, сохраняя наиболее важную информацию, которая позднее будет использована для восстановления исходного сигнала. В конце кодек преобразует сжатые данные обратно в аудио, используя нейронную сеть.
Разработчики Meta пояснили, что они первые использовали нейронную сеть к стереозвуку с частотой дискретизации 48 кГц. Под эту категорию попадают почти все музыкальные CD и большинство музыки в сети.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
А ссылки где?
Если вы про это https://github.com/facebookresearch/encodec - выкидывайте. Это питон. В нормальных проектах один геморой будет.
А вы на православной Java пишите? :)
Где там ещё нейронки нормально можно прикрутить? Не посоветуете? Ну чтобы не к пенсии релиз выкатить или конца мироздания, а хотя бы к следующему десятилетию :)
Нет не на праваславной жаве.
На нормальных католических языках. И не надо заливать про то что там нейронки к пенсии делаются. Нормально можно нейронку за неделю сделать на плюсах, не сложнее чем на питоне. А то и проще. Хотя если неосилятор то не выйдет и до конца жизни.
А питоновский кодек использовать хоть в каком нормальном плеере это такой геморой который точно до пенсии не разгребсти.
Наличие строгой типизации и отсутсвие GC у плюсов явно упрощают разработку :) Удачи в поиске утечек :)
Ёмкость носителей выросла, цена гигабайта упала.
Предпочитаю слушать музыку во flac формате. А они над mp3 всё продолжают издеваться.
Это не для музыки кодек.
кто-то посмотрел Кремниевую долину и сделал pied piper решил сделать :)
У меня есть сомнения, что без потерь так ужать не удастся https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D0%BE%D1%80%D0%B5%D0%BC%D0%B0_%D0%9A%D0%BE%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D0%B8%D0%BA%D0%BE%D0%B2%D0%B0
Собсно вот и превью https://ai.honu.io/papers/encodec/final.mp4
Пользователь отредактировал комментарий 7 ноября 2022, 00:33