Дапамажыце dev.by 🤍
Падтрымаць

DeepSeek выпусціла дзве новыя мадэлі, якія апярэджваюць GPT-5 і Gemini 3.0 Pro

Кітайская кампанія DeepSeek прэзентавала дзве новыя мадэлі — V3.2 і V3.2-Speciale, якія, паводле сцвярджэнняў распрацоўшчыкаў, параўнальныя або пераўзыходзяць па якасці разважанняў GPT-5 і Gemini 3.0 Pro.

Пакінуць каментарый
DeepSeek выпусціла дзве новыя мадэлі, якія апярэджваюць GPT-5 і Gemini 3.0 Pro

Кітайская кампанія DeepSeek прэзентавала дзве новыя мадэлі — V3.2 і V3.2-Speciale, якія, паводле сцвярджэнняў распрацоўшчыкаў, параўнальныя або пераўзыходзяць па якасці разважанняў GPT-5 і Gemini 3.0 Pro.

DeepSeek называе навінкі «сусветнымі лідарамі» ў задачах разважання: афіцыйныя бенчмаркі паказваюць, што версія Speciale пераўзыходзіць GPT-5 High і Gemini 3.0 Pro ў матэматычных і інжынерных задачах, а базавая V3.2 працуе на ўзроўні GPT-5 у паўсядзённых сцэнарыях, пры гэтым патрабуючы менш вылічальных рэсурсаў.

Мадэлі таксама навучаны захоўваць лагічныя ланцужкі пры выкарыстанні знешніх інструментаў: ад вэб-пошуку да выканання кода, што робіць іх прыдатнымі для шматкрокавых задач.

Кампанія сцвярджае, што мадэлі не толькі пераўзыходзяць заходнія аналагі ў бенчмарках, але і працуюць эфектыўней — шмат у чым дзякуючы новай архітэктуры DeepSeek Sparse Attention, якая значна зніжае вылічальныя выдаткі пры працы з доўгімі кантэкстамі.

V3.2 змяшчае 685 мільярдаў параметраў і падтрымлівае вокны кантэксту да 128 тысяч токенаў, аднак такое абсталяванне даступна толькі буйным серверным канфігурацыям. Нягледзячы на гэта, DeepSeek працягвае прытрымлівацца адкрытай мадэлі развіцця: абедзве версіі даступны бясплатна і распаўсюджваюцца пад ліцэнзіяй MIT, уключаючы вагі мадэляў і зыходны код.

Выхад новых мадэляў узмацніў ціск на амерыканскіх распрацоўшчыкаў. Раней у гэтым годзе DeepSeek ужо вымусіла індустрыю перагледзець падыход да мадэляў разважанняў, паказаўшы, што магутныя сістэмы могуць быць даступны без падпіскі. Пасля гэтага OpenAI, Google і Anthropic пачалі выпускаць уласныя мадэлі разважання ChatGPT, Gemini і Claude.

«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
Па тэме
«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
ШІ можна ўзламаць напісаўшы промпт у вершах
ШІ можна ўзламаць, напісаўшы промпт у вершах
Па тэме
ШІ можна ўзламаць, напісаўшы промпт у вершах
У адказах ChatGPT зявілася рэклама
У адказах ChatGPT з’явілася рэклама
Па тэме
У адказах ChatGPT з’явілася рэклама
Чытайце таксама
«Больш не пішу код»: інжынеры Anthropic і OpenAI аддалі 100% працы ШІ — што гэта значыць для рынку
«Больш не пішу код»: інжынеры Anthropic і OpenAI аддалі 100% працы ШІ — што гэта значыць для рынку
«Больш не пішу код»: інжынеры Anthropic і OpenAI аддалі 100% працы ШІ — што гэта значыць для рынку
«Ён палохаюча добры»: ШІ піша код занадта добра — і гэта палохае распрацоўшчыкаў
«Ён палохаюча добры»: ШІ піша код занадта добра — і гэта палохае распрацоўшчыкаў
«Ён палохаюча добры»: ШІ піша код занадта добра — і гэта палохае распрацоўшчыкаў
Аўтар віруснага ШІ-агента прызнаўся, што заліп у вайб-кодынг
Аўтар віруснага ШІ-агента прызнаўся, што заліп у вайб-кодынг
Аўтар віруснага ШІ-агента прызнаўся, што заліп у вайб-кодынг
Чым хутчэй лопне «ШІ-бурбалка», тым лепш для ўсіх — меркаванне эканаміста
Чым хутчэй лопне «ШІ-бурбалка», тым лепш для ўсіх — меркаванне эканаміста
Чым хутчэй лопне «ШІ-бурбалка», тым лепш для ўсіх — меркаванне эканаміста

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.