Дапамажыце dev.by 🤍
Падтрымаць

DeepSeek палепшыла навыкі праграмавання мадэлі V3

Кампанія прэзентавала абнаўленне сваёй адкрытай мадэлі V3, якое значна паляпшае магчымасці праграмавання, а таксама ўсталёўвае новыя стандарты дакладнасці і эфектыўнасці.

Пакінуць каментарый
DeepSeek палепшыла навыкі праграмавання мадэлі V3

Кампанія прэзентавала абнаўленне сваёй адкрытай мадэлі V3, якое значна паляпшае магчымасці праграмавання, а таксама ўсталёўвае новыя стандарты дакладнасці і эфектыўнасці.

Абнаўленне было апублікавана на платформе Hugging Face. Паводле Reuters, метрыкі бенчмаркаў на Hugging Face дэманструюць значныя паляпшэнні новай версіі DeepSeek-V3-0324 у ключавых сферах, такіх як разважанні і напісанне кода, у параўнанні з папярэдняй версіяй.

У DeepSeek заяўляюць, што іх флагманская мадэль R1, выпушчаная праз некалькі тыдняў пасля V3, нягледзячы на сціплы бюджэт на распрацоўку, па некаторых ключавых паказчыках пераўзыйшла ШІ-мадэль o1 ад OpenAI. Пры выкананні пэўных задач выкарыстанне R1 абыходзіцца ў 20-50 разоў танней, чым выкарыстанне мадэлі o1 ад OpenAI.

V3 была прадстаўлена напрыканцы мінулага года. Яна пабудавана на архітэктуры Mixture of Experts і мае агульную колькасць параметраў 671 мільярд, з якіх 37 мільярдаў актывуюцца на кожны токен. Кампанія паведамляла, што выдаткі на навучанне DeepSeek V3 склалі $5,5 мільёнаў, што значна ніжэй, чым расходы іншых тэхналагічных гігантаў, такіх як OpenAI, на навучанне падобных мадэляў.

У студзені аплікацыя DeepSeek абагнала чат-бота ChatGPT і заняла першае месца ў рэйтынгу самых папулярных бясплатных аплікацый у амерыканскім App Store. Поспехі кітайскага стартапа прывялі да падзення ШІ-рынку, у выніку чаго ўдзельнікі сутыкнуліся са значным падзеннем кошту акцый. У прыватнасці, лідар рынку Nvidia 27 студзеня страціла $593 мільярды рынкавай капіталізацыі, што стала найбольшым аднадзённым падзеннем у гісторыі фондавага рынку.

DeepSeek: громкий прорыв или большая афера?
DeepSeek: громкий прорыв или большая афера?
Па тэме
DeepSeek: громкий прорыв или большая афера?
Tencent выпусціла ШІ-мадэль T1 якая канкуруе з DeepSeek R1
Tencent выпусціла ШІ-мадэль T1, якая канкуруе з DeepSeek R1
Па тэме
Tencent выпусціла ШІ-мадэль T1, якая канкуруе з DeepSeek R1
У супрацоўнікаў DeepSeek забіраюць пашпарты каб яны не з’ехалі. А чат-бота ў краіне ўкараняюць паўсюдна
У супрацоўнікаў DeepSeek забіраюць пашпарты, каб яны не з’ехалі. А чат-бота ў краіне ўкараняюць паўсюдна
Па тэме
У супрацоўнікаў DeepSeek забіраюць пашпарты, каб яны не з’ехалі. А чат-бота ў краіне ўкараняюць паўсюдна
Чытайце таксама
Гэты просты спосаб дапамагае павысіць дакладнасць ШІ да 76%
Гэты просты спосаб дапамагае павысіць дакладнасць ШІ да 76%
Гэты просты спосаб дапамагае павысіць дакладнасць ШІ да 76%
2 каментарыя
Ці забярэ ШІ вашу працу? Ёсць адзін індыкатар, які знізіць трывогу
Ці забярэ ШІ вашу працу? Ёсць адзін індыкатар, які знізіць трывогу
Ці забярэ ШІ вашу працу? Ёсць адзін індыкатар, які знізіць трывогу
Інвестар, які прадказаў крах 2008 года: ШІ зніжае прыбытковасць бігтэхаў
Інвестар, які прадказаў крах 2008 года: ШІ зніжае прыбытковасць бігтэхаў
Інвестар, які прадказаў крах 2008 года: ШІ зніжае прыбытковасць бігтэхаў
Аплікацыя «Ты памёр?« стала хітом у Кітаі сярод самотнікаў
Аплікацыя «Ты памёр?« стала хітом у Кітаі сярод самотнікаў
Аплікацыя «Ты памёр?« стала хітом у Кітаі сярод самотнікаў
1 каментарый

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.