DeepSeek представила новую ИИ-модель — почти уровня OpenAI и Google
Китайский разработчик представил две версии новой ИИ-модели V4 — Pro и Flash. Компания утверждает, что модель почти догнала ведущие разработки OpenAI, Google и Anthropic, а в некоторых задачах уже конкурирует с ними.
Китайский разработчик представил две версии новой ИИ-модели V4 — Pro и Flash. Компания утверждает, что модель почти догнала ведущие разработки OpenAI, Google и Anthropic, а в некоторых задачах уже конкурирует с ними.
DeepSeek V4 стала продолжением моделей V3 и R1, которые в прошлом году резко усилили интерес к китайским разработкам в сфере ИИ. Тогда компания заявляла, что смогла добиться близкой к передовым моделям производительности при значительно меньших затратах на обучение.
Новая модель построена по архитектуре mixture-of-experts: при выполнении конкретной задачи активируется только часть параметров, что снижает стоимость работы. DeepSeek V4 Pro имеет 1,6 триллиона параметров, из которых 49 миллиардов активны при обработке запроса.
Сравнение DeepSeek V4 Pro Max с Claude Opus 4.6, GPT-5.4 и Gemini 3.1 Pro в тестах на знания, рассуждение, программирование и агентные задачи. Источник: DeepSeek.
По заявлению компании, это делает ее крупнейшей открытой моделью по числу параметров. Более легкая версия V4 Flash получила 284 миллиардов параметров, из которых активны 13 миллиардов.
Обе версии поддерживают контекстное окно в 1 миллион токенов — этого достаточно, чтобы загружать в запросы крупные документы или большие кодовые базы. При этом модели работают только с текстом, в отличие от многих закрытых конкурентов, которые уже умеют обрабатывать и генерировать изображения, аудио и видео.
OpenAI выпустила GPT-5.5 — свою «самую умную» модель
DeepSeek утверждает, что V4 заметно превосходит предыдущую V3.2 благодаря архитектурным улучшениям. В компании заявили, что новая модель почти «закрыла разрыв» с текущими лидерами рынка как открытыми, так и закрытыми в тестах на рассуждение.
Сильной стороной V4 разработчик называет программирование. Компания утверждает, что модель показывает лучшие результаты среди открытых решений в задачах агентного кодинга и рассуждения, а в соревнованиях по программированию ее показатели «сопоставимы с GPT-5.4».
При этом DeepSeek признает, что в тестах на знания V4 все еще немного уступает последним моделям OpenAI и Google. В техническом отчете компания пишет, что модель «незначительно отстает от GPT-5.4 и Gemini 3.1 Pro», что указывает на отставание от передовых фронтирных моделей примерно на 3–6 месяцев.
Одним из главных преимуществ DeepSeek остается цена. V4 Flash стоит $0,14 за 1 миллион входных токенов и $0,28 за 1 миллион выходных токенов. V4 Pro обойдется в $0,145 за 1 миллион входных токенов и $3,48 за 1 миллион выходных токенов. Это значительно дешевле многих конкурентов: для сравнения, OpenAI и Anthropic берут десятки долларов за сопоставимый объем выходных токенов в своих флагманских моделях.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
Можно затестить бесплатные кредиты на самом DeepSeek и на NVIDIA Nim