Support us

Mistral выпустила ИИ-модель для программирования с открытым кодом

Французский стартап Mistral в сотрудничестве с компанией All Hands AI представил Devstral — новую модель ИИ с открытым исходным кодом, созданную специально для разработки программного обеспечения.

Оставить комментарий
Mistral выпустила ИИ-модель для программирования с открытым кодом

Французский стартап Mistral в сотрудничестве с компанией All Hands AI представил Devstral — новую модель ИИ с открытым исходным кодом, созданную специально для разработки программного обеспечения.

Devstral с 24 миллиардами параметров разработана для эффективной работы на относительно скромном оборудовании, таком как один графический процессор Nvidia RTX 4090 или Mac с 32 ГБ оперативной памяти. Это делает ее идеальной для локального развертывания на устройствах, что особенно важно для разработчиков, заботящихся о конфиденциальности, или тех, кто работает без доступа к интернету.

Модель поддерживает контекстное окно на 128 000 токенов и использует токенизатор Tekken с вокабуляром на 131 000 слов, что обеспечивает надежную работу с большими кодовыми базами. В отличие от традиционных языковых моделей, ориентированных на краткие задачи по автодополнению кода, Devstral оптимизирована для агентных рабочих процессов. Она интегрируется с фреймворками, такими как OpenHands, SWE-Agent и OpenDevin, что позволяет ей перемещаться по большим кодовым базам, редактировать несколько файлов и выполнять многоэтапные задачи.

Mistral утверждает, что Devstral превосходит другие модели с открытым исходным кодом, такие как Gemma 3 27B от Google и V3 от китайской DeepSeek, по бенчмарку SWE-Bench Verified, набрав 46,8% на 500 реальных задачах из GitHub. Она также опережает некоторые закрытые модели, такие как GPT-4.1-mini, более чем на 20 процентных пунктов. «На данный момент это, безусловно, лучшая открытая модель для SWE-Bench Verified и для кодовых агентов», — отметил Батист Розиер, научный сотрудник Mistral.

Модель была доработана на основе Mistral Small 3.1 с использованием методов обучения с подкреплением и техник выравнивания безопасности, что обеспечивает высокую производительность без переобучения на тестовых наборах данных. Devstral развивает идеи предыдущей модели Mistral для программирования — Codestral, модели с 22 миллиардами параметров, запущенной в мае 2024 года. Хотя Codestral получил признание за поддержку более 80 языков программирования, его лицензия ограничивала коммерческое использование. Devstral устраняет это ограничение благодаря открытой лицензии Apache 2.0.

Devstral доступна для скачивания на платформах, таких как Hugging Face, Ollama, Kaggle, LM Studio и Unsloth, и поддерживает фреймворки, включая vLLM, Transformers и Mistral Inference. Также модель доступна через API Mistral Le Platforme под названием `devstral-small-2505` с ценой $0,10 за миллион входных токенов и $0,30 за миллион выходных токенов (примерно 750 000 слов).

OpenAI купила ИИ-стартап дизайнера Apple за $6+ млрд
OpenAI купила ИИ-стартап дизайнера Apple за $6+ млрд
По теме
OpenAI купила ИИ-стартап дизайнера Apple за $6+ млрд
В Беларуси подскочило число вакансий с упоминанием ИИ
В Беларуси подскочило число вакансий с упоминанием ИИ 
По теме
В Беларуси подскочило число вакансий с упоминанием ИИ
Почему ИИ так часто ошибается? Похоже ученые нашли ответ
Почему ИИ так часто ошибается? Похоже, ученые нашли ответ
По теме
Почему ИИ так часто ошибается? Похоже, ученые нашли ответ
Как поддержать редакцию, если вы в Польше?

Помогите нам делать больше полезного контента

Читайте также
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Искусственный интеллект уже стал повседневностью: голосовой помощник включает музыку, робот-пылесос сканирует пространство и убирает квартиру, алгоритм ранжирования настраивает ленту в TikTok, а беспилотные такси уже свободно курсируют по городам. Получить профессию в сфере ИИ с зарплатой от $100k в год тоже стало проще — собрали 5 интересных курсов от Udacity. 
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
4 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.