Дапамажыце dev.by 🤍
Падтрымаць

Новая ШІ-мадэль DeepSeek зробіць працу ўдвая таннейшай за папярэднюю

Кампанія выпусціла эксперыментальную мадэль V3.2-Exp з новай архітэктурай Sparse Attention. Тэхналогія дазваляе значна знізіць вылічальныя выдаткі пры працы з доўгім кантэкстам і ўдвая скараціць кошт API-запытаў.

Пакінуць каментарый
Новая ШІ-мадэль DeepSeek зробіць працу ўдвая таннейшай за папярэднюю

Кампанія выпусціла эксперыментальную мадэль V3.2-Exp з новай архітэктурай Sparse Attention. Тэхналогія дазваляе значна знізіць вылічальныя выдаткі пры працы з доўгім кантэкстам і ўдвая скараціць кошт API-запытаў.

Ключавы элемент сістэмы — модуль Lightning Indexer, які адбірае найбольш важныя фрагменты тэксту для апрацоўкі. Далей сістэма выбірае канкрэтныя токены ўнутры гэтых фрагментаў, загружаючы іх у абмежаванае «акно ўвагі». Такі падыход дазваляе мадэлі эфектыўна працаваць з вялікімі аб’ёмамі тэксту без празмернай нагрузкі на серверы.

Папярэднія тэсты DeepSeek паказалі, што ў доўгіх сесіях кошт аднаго API-выкліку можа знізіцца на 50%. Хоць пакуль незалежныя эксперыменты не пацвярджалі гэтыя дадзеныя, мадэль ужо даступная на Hugging Face у адкрытым доступе, а зыходны артыкул апублікаваны на GitHub.

Параўнанне вынікаў бэнчмаркаў мадэляў DeepSeek-V3.1-Terminus і новай эксперыментальнай DeepSeek-V3.2-Exp. Крыніца: DeepSeek.

Sparse Attention не з’яўляецца новай ідэяй: падобныя метады выкарыстоўваліся OpenAI і Google у папярэдніх пакаленнях мадэляў. Аднак DeepSeek сцвярджае, што ўпершыню рэалізавала эфектыўны варыянт тэхналогіі, які спалучае якасць і эфектыўнасць.

Раней DeepSeek сцвярджала, што яе мадэль R1 здолела паказаць вынікі, параўнальныя з OpenAI, пры значна меншых выдатках на навучанне. Эксперты адзначаюць, што поспех V3.2-Exp можа аказаць уплыў на ўсю індустрыю: зніжэнне выдаткаў на інферэнс дазволіць кампаніям прадастаўляць ШІ-сэрвісы танней і хутчэй, асабліва пры працы з доўгімі кантэкстамі.

OpenAI запусціла «свой TikTok» з генератарам відэа Sora
OpenAI запусціла «свой TikTok» з генератарам відэа Sora
Па тэме
OpenAI запусціла «свой TikTok» з генератарам відэа Sora
ChatGPT навучыўся шопінгу — пакупкі можна рабіць прама ў чаце
ChatGPT навучыўся шопінгу — пакупкі можна рабіць прама ў чаце
Па тэме
ChatGPT навучыўся шопінгу — пакупкі можна рабіць прама ў чаце
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
Па тэме
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
Чытайце таксама
Разработка роботов, дронов и робомобилей: где учат специалистов с зарплатой $100k+
Разработка роботов, дронов и робомобилей: где учат специалистов с зарплатой $100k+
Разработка роботов, дронов и робомобилей: где учат специалистов с зарплатой $100k+
Искусственный интеллект уже стал повседневностью: голосовой помощник включает музыку, робот-пылесос сканирует пространство и убирает квартиру, алгоритм ранжирования настраивает ленту в TikTok, а беспилотные такси уже свободно курсируют по городам. Получить профессию в сфере ИИ с зарплатой от $100k в год тоже стало проще — собрали 5 интересных курсов от Udacity. 
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
2 каментарыя
Hyundai запустила институт искусственного интеллекта
Hyundai запустила институт искусственного интеллекта
Hyundai запустила институт искусственного интеллекта
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
1 каментарый

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.