Дапамажыце dev.by 🤍
Падтрымаць

Mistral выпусціла ШІ-мадэль для праграмавання з адкрытым кодам

Французскі стартап Mistral у супрацоўніцтве з кампаніяй All Hands AI прэзентаваў Devstral — новую ШІ-мадэль з адкрытым зыходным кодам, створаную спецыяльна для распрацоўкі праграмнага забеспячэння.

Пакінуць каментарый
Mistral выпусціла ШІ-мадэль для праграмавання з адкрытым кодам

Французскі стартап Mistral у супрацоўніцтве з кампаніяй All Hands AI прэзентаваў Devstral — новую ШІ-мадэль з адкрытым зыходным кодам, створаную спецыяльна для распрацоўкі праграмнага забеспячэння.

Devstral з 24 мільярдамі параметраў распрацаваная для эфектыўнай працы на адносна сціплым абсталяванні, такім як адзін графічны працэсар Nvidia RTX 4090 або Mac з 32 ГБ аператыўнай памяці. Гэта робіць яе ідэальнай для лакальнага разгортвання на прыладах, што асабліва важна для распрацоўшчыкаў, якія клапоцяцца пра канфідэнцыяльнасць, або тых, хто працуе без доступу да інтэрнэту.

Мадэль падтрымлівае кантэкстнае акно на 128 000 токенаў і выкарыстоўвае такенізатар Tekken з вакабулярам на 131 000 слоў, што забяспечвае надзейную працу з вялікімі кодавымі базамі. У адрозненне ад традыцыйных моўных мадэляў, арыентаваных на кароткія задачы па аўтадапаўненні кода, Devstral аптымізаваная для агентных працоўных працэсаў. Яна інтэгруецца з фреймворкамі, такімі як OpenHands, SWE-Agent і OpenDevin, што дазваляе ёй перамяшчацца па вялікіх кодавых базах, рэдагаваць некалькі файлаў і выконваць шматэтапныя задачы.

Mistral сцвярджае, што Devstral пераўзыходзіць іншыя мадэлі з адкрытым зыходным кодам, такія як Gemma 3 27B ад Google і V3 ад кітайскай DeepSeek, па бенчмарку SWE-Bench Verified, набраўшы 46,8% на 500 рэальных задачах з GitHub. Яна таксама абганяе некаторыя закрытыя мадэлі, такія як GPT-4.1-mini, больш чым на 20 працэнтных пунктаў. «На дадзены момант гэта, безумоўна, лепшая адкрытая мадэль для SWE-Bench Verified і для кодавых агентаў», — адзначыў навуковы супрацоўнік Mistral Батыст Разье.

Мадэль была дапрацаваная на аснове Mistral Small 3.1 з выкарыстаннем метадаў навучання з падмацаваннем і тэхнік выраўноўвання бяспекі, што забяспечвае высокую прадукцыйнасць без перанавучання на тэставых наборах дадзеных. Devstral развівае ідэі папярэдняй мадэлі Mistral для праграмавання — Codestral, мадэлі з 22 мільярдамі параметраў, запушчанай у маі 2024 года. Хаця Codestral атрымала прызнанне за падтрымку больш як 80 моў праграмавання, яе ліцэнзія абмяжоўвала камерцыйнае выкарыстанне. Devstral ліквідуе гэта абмежаванне дзякуючы адкрытай ліцэнзіі Apache 2.0.

Devstral даступная для запампоўкі на платформах, такіх як Hugging Face, Ollama, Kaggle, LM Studio і Unsloth, і падтрымлівае фреймворкі, уключаючы vLLM, Transformers і Mistral Inference. Таксама мадэль даступная праз API Mistral Le Platforme пад назвай devstral-small-2505 з коштам $0,10 за мільён уваходных токенаў і $0,30 за мільён выхадных токенаў (прыблізна 750 000 слоў).

OpenAI набыла ШІ-стартап дызайнера Apple за $6+ млрд
OpenAI набыла ШІ-стартап дызайнера Apple за $6+ млрд
Па тэме
OpenAI набыла ШІ-стартап дызайнера Apple за $6+ млрд
У Беларусі рэзка падскочыла колькасць вакансій са згадкай ШІ
У Беларусі рэзка падскочыла колькасць вакансій са згадкай ШІ
Па тэме
У Беларусі рэзка падскочыла колькасць вакансій са згадкай ШІ
Чаму ШІ так часта памыляецца? Падаецца навукоўцы знайшлі адказ
Чаму ШІ так часта памыляецца? Падаецца, навукоўцы знайшлі адказ
Па тэме
Чаму ШІ так часта памыляецца? Падаецца, навукоўцы знайшлі адказ
Чытайце таксама
Разработка роботов, дронов и робомобилей: где учат специалистов с зарплатой $100k+
Разработка роботов, дронов и робомобилей: где учат специалистов с зарплатой $100k+
Разработка роботов, дронов и робомобилей: где учат специалистов с зарплатой $100k+
Искусственный интеллект уже стал повседневностью: голосовой помощник включает музыку, робот-пылесос сканирует пространство и убирает квартиру, алгоритм ранжирования настраивает ленту в TikTok, а беспилотные такси уже свободно курсируют по городам. Получить профессию в сфере ИИ с зарплатой от $100k в год тоже стало проще — собрали 5 интересных курсов от Udacity. 
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
2 каментарыя
Hyundai запустила институт искусственного интеллекта
Hyundai запустила институт искусственного интеллекта
Hyundai запустила институт искусственного интеллекта
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
1 каментарый

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.