Мы запустили Dzik Pic Store. Заходи к нам в магазин за крутым мерчом ☃️
Support us

DeepSeek улучшила навыки программирования модели V3

Компания представила обновление своей открытой модели V3, которое значительно улучшает возможности программирования, а также устанавливает новые стандарты точности и эффективности.

Оставить комментарий
DeepSeek улучшила навыки программирования модели V3

Компания представила обновление своей открытой модели V3, которое значительно улучшает возможности программирования, а также устанавливает новые стандарты точности и эффективности.

Обновление было опубликовано на платформе Hugging Face. Согласно Reuters, метрики бенчмарков на Hugging Face демонстрируют значительные улучшения новой версии DeepSeek-V3-0324 в ключевых областях, таких как рассуждение и написание кода, по сравнению с предыдущей версией.

В DeepSeek заявляют, что их флагманская модель R1, выпущенная спустя несколько недель после V3, несмотря на скромный бюджет на разработку, по некоторым ключевым показателям превзошла ИИ-модель o1 от OpenAI. При определенных задачах использование R1 обходится в 20-50 раз дешевле, чем использование модели o1 от OpenAI.

V3 была представлена в конце прошлого года. Она построена на архитектуре Mixture of Experts и обладает общим количеством параметров в 671 миллиард, из которых 37 миллиардов активируются на каждый токен. Компания сообщала, что затраты на обучение DeepSeek V3 составили $5,5 миллиона, что значительно ниже расходов, понесенных другими технологическими гигантами, такими как OpenAI, на обучение сопоставимых моделей.

В январе приложение DeepSeek обогнало чат-бота ChatGPT и заняло первое место в рейтинге самых популярных бесплатных приложений в американском App Store. Успехи китайского стартапа привели к обрушению ИИ-рынка, в результате которого участники столкнулись со значительным падением стоимости акций. В частности, лидер рынка Nvidia 27 января потеряла $593 миллиарда рыночной капитализации, что стало крупнейшим однодневным падением в истории фондового рынка.

DeepSeek: громкий прорыв или большая афера?
DeepSeek: громкий прорыв или большая афера?
По теме
DeepSeek: громкий прорыв или большая афера?
Tencent выпустила ИИ-модель T1 которая конкурирует с DeepSeek R1
Tencent выпустила ИИ-модель T1, которая конкурирует с DeepSeek R1
По теме
Tencent выпустила ИИ-модель T1, которая конкурирует с DeepSeek R1
У сотрудников DeepSeek забирают паспорта чтобы не уехали. А чат-бота в стране внедряют повсеместно
У сотрудников DeepSeek забирают паспорта, чтобы не уехали. А чат-бота в стране внедряют повсеместно
По теме
У сотрудников DeepSeek забирают паспорта, чтобы не уехали. А чат-бота в стране внедряют повсеместно
🎊 Dzik Pic Store открыт и готов принимать заказы!

Заходи к нам в магазин

Читайте также
Есть простой способ повысить точность ИИ до 76%
Есть простой способ повысить точность ИИ до 76%
Есть простой способ повысить точность ИИ до 76%
2 комментария
Заберёт ли ИИ вашу работу? Есть один индикатор, который снизит тревогу
Заберёт ли ИИ вашу работу? Есть один индикатор, который снизит тревогу
Заберёт ли ИИ вашу работу? Есть один индикатор, который снизит тревогу
Инвестор, предсказавших крах 2008 года: ИИ снижает прибыльность бигтехов
Инвестор, предсказавших крах 2008 года: ИИ снижает прибыльность бигтехов
Инвестор, предсказавших крах 2008 года: ИИ снижает прибыльность бигтехов
Приложение «Ты умер?» стало хитом в Китае среди одиночек
Приложение «Ты умер?» стало хитом в Китае среди одиночек
Приложение «Ты умер?» стало хитом в Китае среди одиночек
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.