Дапамажыце dev.by 🤍
Падтрымаць

Новая ШІ-мадэль DeepSeek зробіць працу ўдвая таннейшай за папярэднюю

Кампанія выпусціла эксперыментальную мадэль V3.2-Exp з новай архітэктурай Sparse Attention. Тэхналогія дазваляе значна знізіць вылічальныя выдаткі пры працы з доўгім кантэкстам і ўдвая скараціць кошт API-запытаў.

Пакінуць каментарый
Новая ШІ-мадэль DeepSeek зробіць працу ўдвая таннейшай за папярэднюю

Кампанія выпусціла эксперыментальную мадэль V3.2-Exp з новай архітэктурай Sparse Attention. Тэхналогія дазваляе значна знізіць вылічальныя выдаткі пры працы з доўгім кантэкстам і ўдвая скараціць кошт API-запытаў.

Ключавы элемент сістэмы — модуль Lightning Indexer, які адбірае найбольш важныя фрагменты тэксту для апрацоўкі. Далей сістэма выбірае канкрэтныя токены ўнутры гэтых фрагментаў, загружаючы іх у абмежаванае «акно ўвагі». Такі падыход дазваляе мадэлі эфектыўна працаваць з вялікімі аб’ёмамі тэксту без празмернай нагрузкі на серверы.

Папярэднія тэсты DeepSeek паказалі, што ў доўгіх сесіях кошт аднаго API-выкліку можа знізіцца на 50%. Хоць пакуль незалежныя эксперыменты не пацвярджалі гэтыя дадзеныя, мадэль ужо даступная на Hugging Face у адкрытым доступе, а зыходны артыкул апублікаваны на GitHub.

Параўнанне вынікаў бэнчмаркаў мадэляў DeepSeek-V3.1-Terminus і новай эксперыментальнай DeepSeek-V3.2-Exp. Крыніца: DeepSeek.

Sparse Attention не з’яўляецца новай ідэяй: падобныя метады выкарыстоўваліся OpenAI і Google у папярэдніх пакаленнях мадэляў. Аднак DeepSeek сцвярджае, што ўпершыню рэалізавала эфектыўны варыянт тэхналогіі, які спалучае якасць і эфектыўнасць.

Раней DeepSeek сцвярджала, што яе мадэль R1 здолела паказаць вынікі, параўнальныя з OpenAI, пры значна меншых выдатках на навучанне. Эксперты адзначаюць, што поспех V3.2-Exp можа аказаць уплыў на ўсю індустрыю: зніжэнне выдаткаў на інферэнс дазволіць кампаніям прадастаўляць ШІ-сэрвісы танней і хутчэй, асабліва пры працы з доўгімі кантэкстамі.

OpenAI запусціла «свой TikTok» з генератарам відэа Sora
OpenAI запусціла «свой TikTok» з генератарам відэа Sora
Па тэме
OpenAI запусціла «свой TikTok» з генератарам відэа Sora
ChatGPT навучыўся шопінгу — пакупкі можна рабіць прама ў чаце
ChatGPT навучыўся шопінгу — пакупкі можна рабіць прама ў чаце
Па тэме
ChatGPT навучыўся шопінгу — пакупкі можна рабіць прама ў чаце
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
Па тэме
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
Чытайце таксама
У ChatGPT з'явіліся групавыя чаты
У ChatGPT з'явіліся групавыя чаты
У ChatGPT з'явіліся групавыя чаты
1 каментарый
«Хросная маці ШІ»: сапраўдны прарыў пачнецца, калі ШІ навучыцца разумець прастору
«Хросная маці ШІ»: сапраўдны прарыў пачнецца, калі ШІ навучыцца разумець прастору
«Хросная маці ШІ»: сапраўдны прарыў пачнецца, калі ШІ навучыцца разумець прастору
ШІ не ўмее быць таксічным, каб выдаць сябе за чалавека
ШІ не ўмее быць таксічным, каб выдаць сябе за чалавека
ШІ не ўмее быць таксічным, каб выдаць сябе за чалавека
Першы расійскі ШІ-робат дэбютаваў тварам у падлогу
Першы расійскі ШІ-робат дэбютаваў тварам у падлогу
Першы расійскі ШІ-робат дэбютаваў тварам у падлогу
4 каментарыя

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.