DeepSeek выпусціла дзве новыя мадэлі, якія апярэджваюць GPT-5 і Gemini 3.0 Pro

Кітайская кампанія DeepSeek прэзентавала дзве новыя мадэлі — V3.2 і V3.2-Speciale, якія, паводле сцвярджэнняў распрацоўшчыкаў, параўнальныя або пераўзыходзяць па якасці разважанняў GPT-5 і Gemini 3.0 Pro.

Пакінуць каментарый

DeepSeek называе навінкі «сусветнымі лідарамі» ў задачах разважання: афіцыйныя бенчмаркі паказваюць, што версія Speciale пераўзыходзіць GPT-5 High і Gemini 3.0 Pro ў матэматычных і інжынерных задачах, а базавая V3.2 працуе на ўзроўні GPT-5 у паўсядзённых сцэнарыях, пры гэтым патрабуючы менш вылічальных рэсурсаў.

Мадэлі таксама навучаны захоўваць лагічныя ланцужкі пры выкарыстанні знешніх інструментаў: ад вэб-пошуку да выканання кода, што робіць іх прыдатнымі для шматкрокавых задач.

Кампанія сцвярджае, што мадэлі не толькі пераўзыходзяць заходнія аналагі ў бенчмарках, але і працуюць эфектыўней — шмат у чым дзякуючы новай архітэктуры DeepSeek Sparse Attention, якая значна зніжае вылічальныя выдаткі пры працы з доўгімі кантэкстамі.

V3.2 змяшчае 685 мільярдаў параметраў і падтрымлівае вокны кантэксту да 128 тысяч токенаў, аднак такое абсталяванне даступна толькі буйным серверным канфігурацыям. Нягледзячы на гэта, DeepSeek працягвае прытрымлівацца адкрытай мадэлі развіцця: абедзве версіі даступны бясплатна і распаўсюджваюцца пад ліцэнзіяй MIT, уключаючы вагі мадэляў і зыходны код.

Выхад новых мадэляў узмацніў ціск на амерыканскіх распрацоўшчыкаў. Раней у гэтым годзе DeepSeek ужо вымусіла індустрыю перагледзець падыход да мадэляў разважанняў, паказаўшы, што магутныя сістэмы могуць быць даступны без падпіскі. Пасля гэтага OpenAI, Google і Anthropic пачалі выпускаць уласныя мадэлі разважання ChatGPT, Gemini і Claude.

«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
Па тэме
«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
ШІ можна ўзламаць, напісаўшы промпт у вершах
Па тэме
ШІ можна ўзламаць, напісаўшы промпт у вершах
У адказах ChatGPT з’явілася рэклама
Па тэме
У адказах ChatGPT з’явілася рэклама

Читать на dev.by