Дапамажыце dev.by 🤍
Падтрымаць

DeepSeek палепшыла навыкі праграмавання мадэлі V3

Кампанія прэзентавала абнаўленне сваёй адкрытай мадэлі V3, якое значна паляпшае магчымасці праграмавання, а таксама ўсталёўвае новыя стандарты дакладнасці і эфектыўнасці.

Пакінуць каментарый
DeepSeek палепшыла навыкі праграмавання мадэлі V3

Кампанія прэзентавала абнаўленне сваёй адкрытай мадэлі V3, якое значна паляпшае магчымасці праграмавання, а таксама ўсталёўвае новыя стандарты дакладнасці і эфектыўнасці.

Абнаўленне было апублікавана на платформе Hugging Face. Паводле Reuters, метрыкі бенчмаркаў на Hugging Face дэманструюць значныя паляпшэнні новай версіі DeepSeek-V3-0324 у ключавых сферах, такіх як разважанні і напісанне кода, у параўнанні з папярэдняй версіяй.

У DeepSeek заяўляюць, што іх флагманская мадэль R1, выпушчаная праз некалькі тыдняў пасля V3, нягледзячы на сціплы бюджэт на распрацоўку, па некаторых ключавых паказчыках пераўзыйшла ШІ-мадэль o1 ад OpenAI. Пры выкананні пэўных задач выкарыстанне R1 абыходзіцца ў 20-50 разоў танней, чым выкарыстанне мадэлі o1 ад OpenAI.

V3 была прадстаўлена напрыканцы мінулага года. Яна пабудавана на архітэктуры Mixture of Experts і мае агульную колькасць параметраў 671 мільярд, з якіх 37 мільярдаў актывуюцца на кожны токен. Кампанія паведамляла, што выдаткі на навучанне DeepSeek V3 склалі $5,5 мільёнаў, што значна ніжэй, чым расходы іншых тэхналагічных гігантаў, такіх як OpenAI, на навучанне падобных мадэляў.

У студзені аплікацыя DeepSeek абагнала чат-бота ChatGPT і заняла першае месца ў рэйтынгу самых папулярных бясплатных аплікацый у амерыканскім App Store. Поспехі кітайскага стартапа прывялі да падзення ШІ-рынку, у выніку чаго ўдзельнікі сутыкнуліся са значным падзеннем кошту акцый. У прыватнасці, лідар рынку Nvidia 27 студзеня страціла $593 мільярды рынкавай капіталізацыі, што стала найбольшым аднадзённым падзеннем у гісторыі фондавага рынку.

DeepSeek: громкий прорыв или большая афера?
DeepSeek: громкий прорыв или большая афера?
Па тэме
DeepSeek: громкий прорыв или большая афера?
Tencent выпусціла ШІ-мадэль T1 якая канкуруе з DeepSeek R1
Tencent выпусціла ШІ-мадэль T1, якая канкуруе з DeepSeek R1
Па тэме
Tencent выпусціла ШІ-мадэль T1, якая канкуруе з DeepSeek R1
У супрацоўнікаў DeepSeek забіраюць пашпарты каб яны не з’ехалі. А чат-бота ў краіне ўкараняюць паўсюдна
У супрацоўнікаў DeepSeek забіраюць пашпарты, каб яны не з’ехалі. А чат-бота ў краіне ўкараняюць паўсюдна
Па тэме
У супрацоўнікаў DeepSeek забіраюць пашпарты, каб яны не з’ехалі. А чат-бота ў краіне ўкараняюць паўсюдна
Чытайце таксама
«Вамі вельмі лёгка маніпуляваць»: гендырэктар Perplexity выказаўся аб аматарах ШІ-кампаньёнаў
«Вамі вельмі лёгка маніпуляваць»: гендырэктар Perplexity выказаўся аб аматарах ШІ-кампаньёнаў
«Вамі вельмі лёгка маніпуляваць»: гендырэктар Perplexity выказаўся аб аматарах ШІ-кампаньёнаў
Кітайскія стартапы ў гонцы за несмяротнасцю: абяцаюць падоўжыць жыццё да 120 гадоў
Кітайскія стартапы ў гонцы за несмяротнасцю: абяцаюць падоўжыць жыццё да 120 гадоў
Кітайскія стартапы ў гонцы за несмяротнасцю: абяцаюць падоўжыць жыццё да 120 гадоў
3 каментарыя
Google прыдумала, як вырашыць адну з галоўных праблем ШІ
Google прыдумала, як вырашыць адну з галоўных праблем ШІ
Google прыдумала, як вырашыць адну з галоўных праблем ШІ
У карпаратыўным ШІ Copilot вырываецца наперад, а Claude не спраўдзіў чаканняў
У карпаратыўным ШІ Copilot вырываецца наперад, а Claude не спраўдзіў чаканняў
У карпаратыўным ШІ Copilot вырываецца наперад, а Claude не спраўдзіў чаканняў

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.