🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

DeepSeek улучшила навыки программирования модели V3

Компания представила обновление своей открытой модели V3, которое значительно улучшает возможности программирования, а также устанавливает новые стандарты точности и эффективности.

Оставить комментарий
DeepSeek улучшила навыки программирования модели V3

Компания представила обновление своей открытой модели V3, которое значительно улучшает возможности программирования, а также устанавливает новые стандарты точности и эффективности.

Обновление было опубликовано на платформе Hugging Face. Согласно Reuters, метрики бенчмарков на Hugging Face демонстрируют значительные улучшения новой версии DeepSeek-V3-0324 в ключевых областях, таких как рассуждение и написание кода, по сравнению с предыдущей версией.

В DeepSeek заявляют, что их флагманская модель R1, выпущенная спустя несколько недель после V3, несмотря на скромный бюджет на разработку, по некоторым ключевым показателям превзошла ИИ-модель o1 от OpenAI. При определенных задачах использование R1 обходится в 20-50 раз дешевле, чем использование модели o1 от OpenAI.

V3 была представлена в конце прошлого года. Она построена на архитектуре Mixture of Experts и обладает общим количеством параметров в 671 миллиард, из которых 37 миллиардов активируются на каждый токен. Компания сообщала, что затраты на обучение DeepSeek V3 составили $5,5 миллиона, что значительно ниже расходов, понесенных другими технологическими гигантами, такими как OpenAI, на обучение сопоставимых моделей.

В январе приложение DeepSeek обогнало чат-бота ChatGPT и заняло первое место в рейтинге самых популярных бесплатных приложений в американском App Store. Успехи китайского стартапа привели к обрушению ИИ-рынка, в результате которого участники столкнулись со значительным падением стоимости акций. В частности, лидер рынка Nvidia 27 января потеряла $593 миллиарда рыночной капитализации, что стало крупнейшим однодневным падением в истории фондового рынка.

DeepSeek: громкий прорыв или большая афера?
DeepSeek: громкий прорыв или большая афера?
По теме
DeepSeek: громкий прорыв или большая афера?
Tencent выпустила ИИ-модель T1 которая конкурирует с DeepSeek R1
Tencent выпустила ИИ-модель T1, которая конкурирует с DeepSeek R1
По теме
Tencent выпустила ИИ-модель T1, которая конкурирует с DeepSeek R1
У сотрудников DeepSeek забирают паспорта чтобы не уехали. А чат-бота в стране внедряют повсеместно
У сотрудников DeepSeek забирают паспорта, чтобы не уехали. А чат-бота в стране внедряют повсеместно
По теме
У сотрудников DeepSeek забирают паспорта, чтобы не уехали. А чат-бота в стране внедряют повсеместно
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
«Трансатлантический альянс»: Cohere покупает Aleph Alpha, чтобы конкурировать с OpenAI и Google
«Трансатлантический альянс»: Cohere покупает Aleph Alpha, чтобы конкурировать с OpenAI и Google
«Трансатлантический альянс»: Cohere покупает Aleph Alpha, чтобы конкурировать с OpenAI и Google
«Это когнитивное ядерное оружие»: стартапер призвала ввести налог на вред от ИИ
«Это когнитивное ядерное оружие»: стартапер призвала ввести налог на вред от ИИ
«Это когнитивное ядерное оружие»: стартапер призвала ввести налог на вред от ИИ
2 комментария
DeepSeek представила новую ИИ-модель — почти уровня OpenAI и Google
DeepSeek представила новую ИИ-модель — почти уровня OpenAI и Google
DeepSeek представила новую ИИ-модель — почти уровня OpenAI и Google
1 комментарий
Разработчики говорят, что следить за ИИ стало второй работой
Разработчики говорят, что следить за ИИ стало второй работой
Разработчики говорят, что следить за ИИ стало второй работой

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.