Meta выпустила бесплатную модель, которая распознаёт 1600 языков

Компания представила самую масштабную систему распознавания речи в мире — Omnilingual ASR, способную понимать более 1600 языков, количество которых можно потенциально увеличить в разы.

Оставить комментарий

Omnilingual ASR — это мультиязычная система автоматического распознавания речи (ASR), которая использует архитектуру с поддержкой zero-shot обучения. Это значит, что пользователи могут добавлять новые языки без переобучения модели, просто предоставив несколько примеров аудио и текста. Таким образом, технология охватывает почти все языки с письменной системой, включая сотни редких и исчезающих.

Источник: Meta.

Meta открыла код и датасеты под лицензией Apache 2.0, позволив разработчикам использовать систему свободно, в том числе в коммерческих продуктах. Набор включает семейство моделей с числом параметров от 300 миллионов до 7 миллиардов, корпус речи более чем на 350 языках и инструменты для интеграции через PyPI и Hugging Face.

Компания отмечает, что Omnilingual ASR показывает уровень ошибок менее 10% в 78% поддерживаемых языков, включая 500, которые ранее не охватывались ни одной моделью. По словам команды Meta, цель проекта — «снять языковые барьеры и сделать цифровой доступ универсальным».

Релиз стал первым крупным открытым проектом после неудачного запуска Llama 4, вызвавшего критику за ограничительные лицензии и слабую адаптацию в бизнесе. Аналитики рассматривают новый шаг Meta  как стратегическую перезагрузку и возвращение к философии открытого кода. Omnilingual ASR доступна бесплатно на GitHub и Hugging Face.

Google придумала, как решить одну из главных проблем ИИ 
По теме
Google придумала, как решить одну из главных проблем ИИ
В корпоративном ИИ Copilot вырывается вперёд, а Claude не оправдал ожиданий
По теме
В корпоративном ИИ Copilot вырывается вперёд, а Claude не оправдал ожиданий
Акции ИИ-компаний обвалились на $1,2 трлн — худшая неделя с апреля
По теме
Акции ИИ-компаний обвалились на $1,2 трлн — худшая неделя с апреля

Читать на dev.by