DeepSeek выпусціла дзве новыя мадэлі, якія апярэджваюць GPT-5 і Gemini 3.0 Pro
Кітайская кампанія DeepSeek прэзентавала дзве новыя мадэлі — V3.2 і V3.2-Speciale, якія, паводле сцвярджэнняў распрацоўшчыкаў, параўнальныя або пераўзыходзяць па якасці разважанняў GPT-5 і Gemini 3.0 Pro.
Кітайская кампанія DeepSeek прэзентавала дзве новыя мадэлі — V3.2 і V3.2-Speciale, якія, паводле сцвярджэнняў распрацоўшчыкаў, параўнальныя або пераўзыходзяць па якасці разважанняў GPT-5 і Gemini 3.0 Pro.
DeepSeek называе навінкі «сусветнымі лідарамі» ў задачах разважання: афіцыйныя бенчмаркі паказваюць, што версія Speciale пераўзыходзіць GPT-5 High і Gemini 3.0 Pro ў матэматычных і інжынерных задачах, а базавая V3.2 працуе на ўзроўні GPT-5 у паўсядзённых сцэнарыях, пры гэтым патрабуючы менш вылічальных рэсурсаў.
Мадэлі таксама навучаны захоўваць лагічныя ланцужкі пры выкарыстанні знешніх інструментаў: ад вэб-пошуку да выканання кода, што робіць іх прыдатнымі для шматкрокавых задач.
🚀 Launching DeepSeek-V3.2 & DeepSeek-V3.2-Speciale — Reasoning-first models built for agents!
🔹 DeepSeek-V3.2: Official successor to V3.2-Exp. Now live on App, Web & API. 🔹 DeepSeek-V3.2-Speciale: Pushing the boundaries of reasoning capabilities. API-only for now.
Кампанія сцвярджае, што мадэлі не толькі пераўзыходзяць заходнія аналагі ў бенчмарках, але і працуюць эфектыўней — шмат у чым дзякуючы новай архітэктуры DeepSeek Sparse Attention, якая значна зніжае вылічальныя выдаткі пры працы з доўгімі кантэкстамі.
V3.2 змяшчае 685 мільярдаў параметраў і падтрымлівае вокны кантэксту да 128 тысяч токенаў, аднак такое абсталяванне даступна толькі буйным серверным канфігурацыям. Нягледзячы на гэта, DeepSeek працягвае прытрымлівацца адкрытай мадэлі развіцця: абедзве версіі даступны бясплатна і распаўсюджваюцца пад ліцэнзіяй MIT, уключаючы вагі мадэляў і зыходны код.
Выхад новых мадэляў узмацніў ціск на амерыканскіх распрацоўшчыкаў. Раней у гэтым годзе DeepSeek ужо вымусіла індустрыю перагледзець падыход да мадэляў разважанняў, паказаўшы, што магутныя сістэмы могуць быць даступны без падпіскі. Пасля гэтага OpenAI, Google і Anthropic пачалі выпускаць уласныя мадэлі разважання ChatGPT, Gemini і Claude.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.