Mistral запустил первую для Европы рассуждающую модель. Она мыслит на разных языках
Французский ИИ-стартап Mistral выпустил свою первую модель, способную к пошаговым логическим рассуждениям.
Французский ИИ-стартап Mistral выпустил свою первую модель, способную к пошаговым логическим рассуждениям.
Французский ИИ-стартап Mistral выпустил свою первую модель, способную к пошаговым логическим рассуждениям.
Разработчики утверждают, что Magistral сопоставима с конкурентами от OpenAI и DeepSeek. Её особенность в том, что она умеет мыслить на разных языках: особенно хорошо она думает на английском, французском, испанском, немецком, итальянском, русском, арабском и даже упрощённом китайском. В дальнейшем языковую поддержку планируется расширить. Обычно модели думают на языке страны своего происхождения: американские — на английском, китайские — на китайском.
Также, по словам разработчиков, Magistral отлично решает математические задачи и отлично кодит. Модель может найти применение в самых разных сферах, включая креативную, юридическую, финансы и разработку ПО. Она подходит для таких задач, как исследования, стратегическое планирование, оптимизация деятельности, оценка рисков и прогнозирование для принятия решений на основе данных.
Стартап представил две версии модели: опенсорсную Magistral Small на 24 млрд параметров и более мощную Magistral Medium, которая ориентирована на корпоративных клиентов. На бенчмарке AIME2024 первая набрала 70,7%, а вторая — 73,6%.
Magistral Small имеет контекстное окно в 128 тысяч токенов. Она доступна на Hugging Face по лицензии Apache 2.0, которая допускает коммерческое использование. Также разработчики добавили превью Magistral Medium в API, на облачную платформу Amazon SageMaker и в фирменного чат-бота Le Chat — там появились специальные кнопки для рассуждений.
Mistral оценивается в $6 млрд. За время работы он привлёк инвестиции от Nvidia, Andreessen Horowitz, Lightspeed, General Catalyst, Salesforce и Microsoft. Стартап выкладывает веса некоторых своих моделей — то есть параметры, которые настраиваются в процессе обучения и определяют их поведение, — в открытый доступ. Это позволяет сторонним разработчикам модифицировать модели и избежать огромных затрат времени и ресурсов на создание таких моделей с нуля.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
""""""""""""" - трымайце двукоссі ў рэдакцыю, вам яшчэ спатрэбяцца