Дапамажыце dev.by 🤍
Падтрымаць

Новая ШІ-мадэль DeepSeek зробіць працу ўдвая таннейшай за папярэднюю

Кампанія выпусціла эксперыментальную мадэль V3.2-Exp з новай архітэктурай Sparse Attention. Тэхналогія дазваляе значна знізіць вылічальныя выдаткі пры працы з доўгім кантэкстам і ўдвая скараціць кошт API-запытаў.

Пакінуць каментарый
Новая ШІ-мадэль DeepSeek зробіць працу ўдвая таннейшай за папярэднюю

Кампанія выпусціла эксперыментальную мадэль V3.2-Exp з новай архітэктурай Sparse Attention. Тэхналогія дазваляе значна знізіць вылічальныя выдаткі пры працы з доўгім кантэкстам і ўдвая скараціць кошт API-запытаў.

Ключавы элемент сістэмы — модуль Lightning Indexer, які адбірае найбольш важныя фрагменты тэксту для апрацоўкі. Далей сістэма выбірае канкрэтныя токены ўнутры гэтых фрагментаў, загружаючы іх у абмежаванае «акно ўвагі». Такі падыход дазваляе мадэлі эфектыўна працаваць з вялікімі аб’ёмамі тэксту без празмернай нагрузкі на серверы.

Папярэднія тэсты DeepSeek паказалі, што ў доўгіх сесіях кошт аднаго API-выкліку можа знізіцца на 50%. Хоць пакуль незалежныя эксперыменты не пацвярджалі гэтыя дадзеныя, мадэль ужо даступная на Hugging Face у адкрытым доступе, а зыходны артыкул апублікаваны на GitHub.

Параўнанне вынікаў бэнчмаркаў мадэляў DeepSeek-V3.1-Terminus і новай эксперыментальнай DeepSeek-V3.2-Exp. Крыніца: DeepSeek.

Sparse Attention не з’яўляецца новай ідэяй: падобныя метады выкарыстоўваліся OpenAI і Google у папярэдніх пакаленнях мадэляў. Аднак DeepSeek сцвярджае, што ўпершыню рэалізавала эфектыўны варыянт тэхналогіі, які спалучае якасць і эфектыўнасць.

Раней DeepSeek сцвярджала, што яе мадэль R1 здолела паказаць вынікі, параўнальныя з OpenAI, пры значна меншых выдатках на навучанне. Эксперты адзначаюць, што поспех V3.2-Exp можа аказаць уплыў на ўсю індустрыю: зніжэнне выдаткаў на інферэнс дазволіць кампаніям прадастаўляць ШІ-сэрвісы танней і хутчэй, асабліва пры працы з доўгімі кантэкстамі.

OpenAI запусціла «свой TikTok» з генератарам відэа Sora
OpenAI запусціла «свой TikTok» з генератарам відэа Sora
Па тэме
OpenAI запусціла «свой TikTok» з генератарам відэа Sora
ChatGPT навучыўся шопінгу — пакупкі можна рабіць прама ў чаце
ChatGPT навучыўся шопінгу — пакупкі можна рабіць прама ў чаце
Па тэме
ChatGPT навучыўся шопінгу — пакупкі можна рабіць прама ў чаце
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
Па тэме
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
Чытайце таксама
ШІ робіць сур'ёзныя памылкі ў навінах у палове выпадкаў
ШІ робіць сур'ёзныя памылкі ў навінах у палове выпадкаў
ШІ робіць сур'ёзныя памылкі ў навінах у палове выпадкаў
ШІ прывёў да буму найму Salesforce. Але толькі ў адной сферы
ШІ прывёў да буму найму Salesforce. Але толькі ў адной сферы
ШІ прывёў да буму найму Salesforce. Але толькі ў адной сферы
МТС запусціў ШІ-асістэнта. Вось колькі каштуе
МТС запусціў ШІ-асістэнта. Вось колькі каштуе
МТС запусціў ШІ-асістэнта. Вось колькі каштуе
1 каментарый
OpenAI прэзентавала ШІ-браўзэр Atlas — з убудаваным ChatGPT
OpenAI прэзентавала ШІ-браўзэр Atlas — з убудаваным ChatGPT
OpenAI прэзентавала ШІ-браўзэр Atlas — з убудаваным ChatGPT

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.