Дапамажыце dev.by 🤍
Падтрымаць

DeepSeek выпусціла дзве новыя мадэлі, якія апярэджваюць GPT-5 і Gemini 3.0 Pro

Кітайская кампанія DeepSeek прэзентавала дзве новыя мадэлі — V3.2 і V3.2-Speciale, якія, паводле сцвярджэнняў распрацоўшчыкаў, параўнальныя або пераўзыходзяць па якасці разважанняў GPT-5 і Gemini 3.0 Pro.

Пакінуць каментарый
DeepSeek выпусціла дзве новыя мадэлі, якія апярэджваюць GPT-5 і Gemini 3.0 Pro

Кітайская кампанія DeepSeek прэзентавала дзве новыя мадэлі — V3.2 і V3.2-Speciale, якія, паводле сцвярджэнняў распрацоўшчыкаў, параўнальныя або пераўзыходзяць па якасці разважанняў GPT-5 і Gemini 3.0 Pro.

DeepSeek называе навінкі «сусветнымі лідарамі» ў задачах разважання: афіцыйныя бенчмаркі паказваюць, што версія Speciale пераўзыходзіць GPT-5 High і Gemini 3.0 Pro ў матэматычных і інжынерных задачах, а базавая V3.2 працуе на ўзроўні GPT-5 у паўсядзённых сцэнарыях, пры гэтым патрабуючы менш вылічальных рэсурсаў.

Мадэлі таксама навучаны захоўваць лагічныя ланцужкі пры выкарыстанні знешніх інструментаў: ад вэб-пошуку да выканання кода, што робіць іх прыдатнымі для шматкрокавых задач.

Кампанія сцвярджае, што мадэлі не толькі пераўзыходзяць заходнія аналагі ў бенчмарках, але і працуюць эфектыўней — шмат у чым дзякуючы новай архітэктуры DeepSeek Sparse Attention, якая значна зніжае вылічальныя выдаткі пры працы з доўгімі кантэкстамі.

V3.2 змяшчае 685 мільярдаў параметраў і падтрымлівае вокны кантэксту да 128 тысяч токенаў, аднак такое абсталяванне даступна толькі буйным серверным канфігурацыям. Нягледзячы на гэта, DeepSeek працягвае прытрымлівацца адкрытай мадэлі развіцця: абедзве версіі даступны бясплатна і распаўсюджваюцца пад ліцэнзіяй MIT, уключаючы вагі мадэляў і зыходны код.

Выхад новых мадэляў узмацніў ціск на амерыканскіх распрацоўшчыкаў. Раней у гэтым годзе DeepSeek ужо вымусіла індустрыю перагледзець падыход да мадэляў разважанняў, паказаўшы, што магутныя сістэмы могуць быць даступны без падпіскі. Пасля гэтага OpenAI, Google і Anthropic пачалі выпускаць уласныя мадэлі разважання ChatGPT, Gemini і Claude.

«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
Па тэме
«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
ШІ можна ўзламаць напісаўшы промпт у вершах
ШІ можна ўзламаць, напісаўшы промпт у вершах
Па тэме
ШІ можна ўзламаць, напісаўшы промпт у вершах
У адказах ChatGPT зявілася рэклама
У адказах ChatGPT з’явілася рэклама
Па тэме
У адказах ChatGPT з’явілася рэклама
Чытайце таксама
ШІ пазбавіць працы да 40 млн чалавек толькі ў ЗША, але выйсце ёсць — меркаванне эксперта
ШІ пазбавіць працы да 40 млн чалавек толькі ў ЗША, але выйсце ёсць — меркаванне эксперта
ШІ пазбавіць працы да 40 млн чалавек толькі ў ЗША, але выйсце ёсць — меркаванне эксперта
CEO Microsoft назваў ключавы навык працаўнікоў у эпоху ШІ
CEO Microsoft назваў ключавы навык працаўнікоў у эпоху ШІ
CEO Microsoft назваў ключавы навык працаўнікоў у эпоху ШІ
У адказах ChatGPT з'явілася рэклама
У адказах ChatGPT з'явілася рэклама
У адказах ChatGPT з'явілася рэклама
«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ
«Нас чакае сапраўдная бойня»: інвестар пра будучыню рынку ШІ

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.