Дапамажыце dev.by 🤍
Падтрымаць

DeepSeek палепшыла навыкі праграмавання мадэлі V3

Кампанія прэзентавала абнаўленне сваёй адкрытай мадэлі V3, якое значна паляпшае магчымасці праграмавання, а таксама ўсталёўвае новыя стандарты дакладнасці і эфектыўнасці.

Пакінуць каментарый
DeepSeek палепшыла навыкі праграмавання мадэлі V3

Кампанія прэзентавала абнаўленне сваёй адкрытай мадэлі V3, якое значна паляпшае магчымасці праграмавання, а таксама ўсталёўвае новыя стандарты дакладнасці і эфектыўнасці.

Абнаўленне было апублікавана на платформе Hugging Face. Паводле Reuters, метрыкі бенчмаркаў на Hugging Face дэманструюць значныя паляпшэнні новай версіі DeepSeek-V3-0324 у ключавых сферах, такіх як разважанні і напісанне кода, у параўнанні з папярэдняй версіяй.

У DeepSeek заяўляюць, што іх флагманская мадэль R1, выпушчаная праз некалькі тыдняў пасля V3, нягледзячы на сціплы бюджэт на распрацоўку, па некаторых ключавых паказчыках пераўзыйшла ШІ-мадэль o1 ад OpenAI. Пры выкананні пэўных задач выкарыстанне R1 абыходзіцца ў 20-50 разоў танней, чым выкарыстанне мадэлі o1 ад OpenAI.

V3 была прадстаўлена напрыканцы мінулага года. Яна пабудавана на архітэктуры Mixture of Experts і мае агульную колькасць параметраў 671 мільярд, з якіх 37 мільярдаў актывуюцца на кожны токен. Кампанія паведамляла, што выдаткі на навучанне DeepSeek V3 склалі $5,5 мільёнаў, што значна ніжэй, чым расходы іншых тэхналагічных гігантаў, такіх як OpenAI, на навучанне падобных мадэляў.

У студзені аплікацыя DeepSeek абагнала чат-бота ChatGPT і заняла першае месца ў рэйтынгу самых папулярных бясплатных аплікацый у амерыканскім App Store. Поспехі кітайскага стартапа прывялі да падзення ШІ-рынку, у выніку чаго ўдзельнікі сутыкнуліся са значным падзеннем кошту акцый. У прыватнасці, лідар рынку Nvidia 27 студзеня страціла $593 мільярды рынкавай капіталізацыі, што стала найбольшым аднадзённым падзеннем у гісторыі фондавага рынку.

DeepSeek: громкий прорыв или большая афера?
DeepSeek: громкий прорыв или большая афера?
Па тэме
DeepSeek: громкий прорыв или большая афера?
Tencent выпусціла ШІ-мадэль T1 якая канкуруе з DeepSeek R1
Tencent выпусціла ШІ-мадэль T1, якая канкуруе з DeepSeek R1
Па тэме
Tencent выпусціла ШІ-мадэль T1, якая канкуруе з DeepSeek R1
У супрацоўнікаў DeepSeek забіраюць пашпарты каб яны не з’ехалі. А чат-бота ў краіне ўкараняюць паўсюдна
У супрацоўнікаў DeepSeek забіраюць пашпарты, каб яны не з’ехалі. А чат-бота ў краіне ўкараняюць паўсюдна
Па тэме
У супрацоўнікаў DeepSeek забіраюць пашпарты, каб яны не з’ехалі. А чат-бота ў краіне ўкараняюць паўсюдна
Чытайце таксама
США запретили IT-компаниям с господдержкой строить заводы в Китае в течение 10 лет
США запретили IT-компаниям с господдержкой строить заводы в Китае в течение 10 лет
США запретили IT-компаниям с господдержкой строить заводы в Китае в течение 10 лет
В Китае прошел первый полет беспилотника на солнечных батареях
В Китае прошел первый полет беспилотника на солнечных батареях
В Китае прошел первый полет беспилотника на солнечных батареях
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
2 каментарыя
Tencent впервые за 18 лет зафиксировала максимальное падение доходов
Tencent впервые за 18 лет зафиксировала максимальное падение доходов
Tencent впервые за 18 лет зафиксировала максимальное падение доходов

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.