Дапамажыце dev.by 🤍
Падтрымаць

Новая ШІ-мадэль DeepSeek зробіць працу ўдвая таннейшай за папярэднюю

Кампанія выпусціла эксперыментальную мадэль V3.2-Exp з новай архітэктурай Sparse Attention. Тэхналогія дазваляе значна знізіць вылічальныя выдаткі пры працы з доўгім кантэкстам і ўдвая скараціць кошт API-запытаў.

Пакінуць каментарый
Новая ШІ-мадэль DeepSeek зробіць працу ўдвая таннейшай за папярэднюю

Кампанія выпусціла эксперыментальную мадэль V3.2-Exp з новай архітэктурай Sparse Attention. Тэхналогія дазваляе значна знізіць вылічальныя выдаткі пры працы з доўгім кантэкстам і ўдвая скараціць кошт API-запытаў.

Ключавы элемент сістэмы — модуль Lightning Indexer, які адбірае найбольш важныя фрагменты тэксту для апрацоўкі. Далей сістэма выбірае канкрэтныя токены ўнутры гэтых фрагментаў, загружаючы іх у абмежаванае «акно ўвагі». Такі падыход дазваляе мадэлі эфектыўна працаваць з вялікімі аб’ёмамі тэксту без празмернай нагрузкі на серверы.

Папярэднія тэсты DeepSeek паказалі, што ў доўгіх сесіях кошт аднаго API-выкліку можа знізіцца на 50%. Хоць пакуль незалежныя эксперыменты не пацвярджалі гэтыя дадзеныя, мадэль ужо даступная на Hugging Face у адкрытым доступе, а зыходны артыкул апублікаваны на GitHub.

Параўнанне вынікаў бэнчмаркаў мадэляў DeepSeek-V3.1-Terminus і новай эксперыментальнай DeepSeek-V3.2-Exp. Крыніца: DeepSeek.

Sparse Attention не з’яўляецца новай ідэяй: падобныя метады выкарыстоўваліся OpenAI і Google у папярэдніх пакаленнях мадэляў. Аднак DeepSeek сцвярджае, што ўпершыню рэалізавала эфектыўны варыянт тэхналогіі, які спалучае якасць і эфектыўнасць.

Раней DeepSeek сцвярджала, што яе мадэль R1 здолела паказаць вынікі, параўнальныя з OpenAI, пры значна меншых выдатках на навучанне. Эксперты адзначаюць, што поспех V3.2-Exp можа аказаць уплыў на ўсю індустрыю: зніжэнне выдаткаў на інферэнс дазволіць кампаніям прадастаўляць ШІ-сэрвісы танней і хутчэй, асабліва пры працы з доўгімі кантэкстамі.

OpenAI запусціла «свой TikTok» з генератарам відэа Sora
OpenAI запусціла «свой TikTok» з генератарам відэа Sora
Па тэме
OpenAI запусціла «свой TikTok» з генератарам відэа Sora
ChatGPT навучыўся шопінгу — пакупкі можна рабіць прама ў чаце
ChatGPT навучыўся шопінгу — пакупкі можна рабіць прама ў чаце
Па тэме
ChatGPT навучыўся шопінгу — пакупкі можна рабіць прама ў чаце
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
Па тэме
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
Чытайце таксама
«Такога яшчэ не было»: заснавальнік a16z растлумачыў, чаму ШІ не паўторыць дотком
«Такога яшчэ не было»: заснавальнік a16z растлумачыў, чаму ШІ не паўторыць дотком
«Такога яшчэ не было»: заснавальнік a16z растлумачыў, чаму ШІ не паўторыць дотком
Мэцью Макконахі запатэнтаваў свае мемы, каб абараніцца ад ШІ
Мэцью Макконахі запатэнтаваў свае мемы, каб абараніцца ад ШІ
Мэцью Макконахі запатэнтаваў свае мемы, каб абараніцца ад ШІ
OpenAI можа збанкрутаваць ўжо ў 2027 годзе — меркаванне эксперта
OpenAI можа збанкрутаваць ўжо ў 2027 годзе — меркаванне эксперта
OpenAI можа збанкрутаваць ўжо ў 2027 годзе — меркаванне эксперта
2 каментарыя
Google прапаноўвае ўгоду: Gemini стане больш персаналізаваным у абмен на вашы дадзеныя
Google прапаноўвае ўгоду: Gemini стане больш персаналізаваным у абмен на вашы дадзеныя
Google прапаноўвае ўгоду: Gemini стане больш персаналізаваным у абмен на вашы дадзеныя

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.