Дапамажыце dev.by 🤍
Падтрымаць

DeepSeek выпусціла дзве новыя мадэлі, якія апярэджваюць GPT-5 і Gemini 3.0 Pro

Кітайская кампанія DeepSeek прэзентавала дзве новыя мадэлі — V3.2 і V3.2-Speciale, якія, паводле сцвярджэнняў распрацоўшчыкаў, параўнальныя або пераўзыходзяць па якасці разважанняў GPT-5 і Gemini 3.0 Pro.

Пакінуць каментарый
DeepSeek выпусціла дзве новыя мадэлі, якія апярэджваюць GPT-5 і Gemini 3.0 Pro

Кітайская кампанія DeepSeek прэзентавала дзве новыя мадэлі — V3.2 і V3.2-Speciale, якія, паводле сцвярджэнняў распрацоўшчыкаў, параўнальныя або пераўзыходзяць па якасці разважанняў GPT-5 і Gemini 3.0 Pro.

DeepSeek называе навінкі «сусветнымі лідарамі» ў задачах разважання: афіцыйныя бенчмаркі паказваюць, што версія Speciale пераўзыходзіць GPT-5 High і Gemini 3.0 Pro ў матэматычных і інжынерных задачах, а базавая V3.2 працуе на ўзроўні GPT-5 у паўсядзённых сцэнарыях, пры гэтым патрабуючы менш вылічальных рэсурсаў.

Мадэлі таксама навучаны захоўваць лагічныя ланцужкі пры выкарыстанні знешніх інструментаў: ад вэб-пошуку да выканання кода, што робіць іх прыдатнымі для шматкрокавых задач.

Кампанія сцвярджае, што мадэлі не толькі пераўзыходзяць заходнія аналагі ў бенчмарках, але і працуюць эфектыўней — шмат у чым дзякуючы новай архітэктуры DeepSeek Sparse Attention, якая значна зніжае вылічальныя выдаткі пры працы з доўгімі кантэкстамі.

V3.2 змяшчае 685 мільярдаў параметраў і падтрымлівае вокны кантэксту да 128 тысяч токенаў, аднак такое абсталяванне даступна толькі буйным серверным канфігурацыям. Нягледзячы на гэта, DeepSeek працягвае прытрымлівацца адкрытай мадэлі развіцця: абедзве версіі даступны бясплатна і распаўсюджваюцца пад ліцэнзіяй MIT, уключаючы вагі мадэляў і зыходны код.

Выхад новых мадэляў узмацніў ціск на амерыканскіх распрацоўшчыкаў. Раней у гэтым годзе DeepSeek ужо вымусіла індустрыю перагледзець падыход да мадэляў разважанняў, паказаўшы, што магутныя сістэмы могуць быць даступны без падпіскі. Пасля гэтага OpenAI, Google і Anthropic пачалі выпускаць уласныя мадэлі разважання ChatGPT, Gemini і Claude.

«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
Па тэме
«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
ШІ можна ўзламаць напісаўшы промпт у вершах
ШІ можна ўзламаць, напісаўшы промпт у вершах
Па тэме
ШІ можна ўзламаць, напісаўшы промпт у вершах
У адказах ChatGPT зявілася рэклама
У адказах ChatGPT з’явілася рэклама
Па тэме
У адказах ChatGPT з’явілася рэклама
Чытайце таксама
У ЗША выйграна першая справа аб залежнасці ад сацсетак — Meta і Google пакараны за тое, як пабудаваны іх платформы
У ЗША выйграна першая справа аб залежнасці ад сацсетак — Meta і Google пакараны за тое, як пабудаваны іх платформы
У ЗША выйграна першая справа аб залежнасці ад сацсетак — Meta і Google пакараны за тое, як пабудаваны іх платформы
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.