DeepSeek выпустила две новые модели, которые обгоняют GPT-5 и Gemini 3.0 Pro

Китайская компания DeepSeek представила две новых модели — V3.2 и V3.2-Speciale, которые, по заявлениям разработчиков, сопоставимы или превосходят по качеству рассуждений GPT-5 и Gemini 3.0 Pro.

Оставить комментарий

DeepSeek называет новинки «мировыми лидерами» в задачах рассуждений: официальные бенчмарки показывают, что версия Speciale превосходит GPT-5 High и Gemini 3.0 Pro в математических и инженерных задачах, а базовая V3.2 работает на уровне GPT-5 в повседневных сценариях, при этом требуя меньше вычислительных ресурсов.

Модели также обучены сохранять логические цепочки при использовании внешних инструментов: от веб-поиска до исполнения кода, что делает их пригодными для многошаговых задач.

Компания утверждает, что модели не только превосходят западные аналоги в бенчмарках, но и работают эффективнее — во многом благодаря новой архитектуре DeepSeek Sparse Attention, которая заметно снижает вычислительные затраты при работе с длинными контекстами.

V3.2 содержит 685 миллиардов параметров и поддерживает окна контекста до 128 тысяч токенов, однако такое оборудование доступно лишь крупным серверным конфигурациям. Несмотря на это, DeepSeek продолжает придерживаться открытой модели развития: обе версии доступны бесплатно и распространяются под лицензией MIT, включая веса моделей и исходный код.

Выход новых моделей усилил давление на американских разработчиков. Ранее в этом году DeepSeek уже вынудила индустрию пересмотреть подход к моделям рассуждений, показав, что мощные системы могут быть доступны без подписки. После этого OpenAI, Google и Anthropic начали выпускать собственные модели рассуждения ChatGPT, Gemini и Claude.

«Нас ждёт настоящая бойня»: инвестор о будущем ИИ-рынка
По теме
«Нас ждёт настоящая бойня»: инвестор о будущем ИИ-рынка
ИИ можно взломать, написав промпт в стихах
По теме
ИИ можно взломать, написав промпт в стихах
В ответах ChatGPT появилась реклама
По теме
В ответах ChatGPT появилась реклама

Читать на dev.by