Microsoft выпустила сразу три ИИ-модели: для текста, голоса и изображений
Компания представила три новых базовых ИИ-модели собственной разработки — MAI-Transcribe-1, MAI–Voice-1 и MAI–Image-2. Модели уже доступны через платформу Microsoft Foundry и тестовую среду MAI Playground.
Компания представила три новых базовых ИИ-модели собственной разработки — MAI-Transcribe-1, MAI–Voice-1 и MAI–Image-2. Модели уже доступны через платформу Microsoft Foundry и тестовую среду MAI Playground.
Флагманской разработкой стала модель MAI-Transcribe-1 для преобразования речи в текст. По данным компании, она показывает лучшую точность на бенчмарке FLEURS для 25 наиболее используемых языков и работает в 2,5 раза быстрее предыдущего решения Azure Fast. В Microsoft заявляют, что модель оптимизирована для реальных условий — с шумом и нестабильным звуком.
Вторая модель, MAI–Voice-1, предназначена для генерации речи. Она способна создавать до 60 секунд аудио всего за одну секунду, сохраняя интонации и особенности голоса. Также разработчики добавили возможность создавать собственный голос на основе нескольких секунд записи, что упрощает создание голосовых интерфейсов и ИИ-агентов.
MAI–Image-2 отвечает за генерацию изображений и уже используется в ряде продуктов компании, включая Bing и PowerPoint. По данным компании, новая версия обеспечивает более высокую скорость и качество по сравнению с предыдущими решениями.
Разработкой моделей занималась команда Microsoft AI под руководством Мустафы Сулеймана, сформированная в конце 2025 года. По его словам, компания делает ставку на практическое применение технологий. «В Microsoft AI мы создаем „гуманистический ИИ“. Мы придерживаемся подхода, при котором человек находится в центре — модели обучаются под реальные способы коммуникации и практические задачи», — написал он.
При этом Microsoft сохраняет стратегическое партнерство с OpenAI, инвестировав в него более $13 миллиардов и продолжая использовать его модели в своих продуктах. Однако новые разработки свидетельствуют о стремлении компании снизить зависимость от внешних поставщиков технологий и развивать собственную ИИ-экосистему.
Одним из ключевых факторов конкурентоспособности Microsoft называет стоимость. По словам Сулеймана, модели намеренно позиционируются как более дешевые по сравнению с решениями других облачных провайдеров, включая Amazon и Google.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.