Николай Чикишев world 2 июня 2026, 12:09

Китайский стартап представил мощную кодинг-модель, которая дешевле GPT-5.5 и Gemini 3.1 Pro

Китайский ИИ-стартап MiniMax представил новую флагманскую модель M3, ориентированную на программирование, ИИ-агентов и работу с длинным контекстом.

1 комментарий

Китайский стартап представил мощную кодинг-модель, которая дешевле GPT-5.5 и Gemini 3.1 Pro

Китайский ИИ-стартап MiniMax представил новую флагманскую модель M3, ориентированную на программирование, ИИ-агентов и работу с длинным контекстом.

MiniMax утверждает, что M3 показывает конкурентные результаты на ключевых бенчмарках для программирования и агентных задач. На SWE-Bench Pro модель набрала 59%, обойдя, по данным компании, GPT-5.5 и Gemini 3.1 Pro. На Terminal Bench 2.1 результат составил 66%, на MCP Atlas — 74,2%, а на BrowseComp — 83,5%.

Главная ставка MiniMax — не только на качество, но и на цену. В течение первой недели модель доступна через API по сниженной цене: $0,30 за 1 миллион входных токенов и $1,20 за 1 миллион выходных токенов. Полная цена составит $0,60 и $2,40 соответственно. VentureBeat оценивает, что даже по полной цене MiniMax-M3 стоит примерно 8–20% от стоимости ведущих закрытых моделей.

Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities

— Coding & Agentic Frontier: 59,0% SWE-Bench Pro, 66,0% Terminal Bench 2.1, 34,8% SWE-fficiency, 28,8% KernelBench Hard, 74,2% MCP Atlas
— MiniMax Sparse Attention scales context to 1M
-… pic.twitter.com/TF891iJukF
— MiniMax (official) (@MiniMax_AI) June 1, 2026

Компания также запустила новые тарифные планы для работы с токенами. Базовый план Plus стоит $20 в месяц при годовой оплате и включает около 1,7 миллиарда токенов в месяц. Более дорогие планы Max и Ultra стоят $50 и $120 в месяц и рассчитаны на большее число параллельных агентов, а также включают лимиты на генерацию видео через Hailuo 2.3.

Снижение стоимости MiniMax связывает с новой архитектурой MiniMax Sparse Attention. В отличие от традиционного подхода, где вычислительная сложность резко растет с увеличением длины контекста, MSA обрабатывает только наиболее релевантные блоки данных. По заявлению компании, при контексте в 1 миллион токенов вычислительная нагрузка на один токен снизилась до 1/20 от уровня предыдущего поколения модели.

🔥API Pricing & Promotion
— 50% off standard usage (≤512K context) during the first 7 days
— Priority access available through: [email protected]
— Self-serve access for all users coming in the next few days pic.twitter.com/KM3QbYjEdj
— MiniMax (official) (@MiniMax_AI) June 1, 2026

MiniMax утверждает, что новая архитектура ускоряет предварительную обработку контекста в 9 раз, а генерацию ответа — в 15 раз. Это особенно важно для длинных программных задач, где модель должна работать с большим объемом кода, документации, логов и результатов выполнения команд.

Стартап также представил продукт MiniMax Code — ИИ-агента для разработчиков на базе M3. Он может разбивать крупные инженерные задачи на несколько этапов, запускать параллельные процессы и использовать схему Producer + Verifier, где один агент пишет код, а второй проверяет и тестирует результат. По заявлению компании, такая система может автономно работать над задачами в течение длительного времени.

Разработчики смогут подключать M3 через API к популярным средам и инструментам, включая Claude Code, Cursor, Roo Code и Cline. В API предусмотрен переключаемый режим reasoning: при включении модель тратит больше ресурсов на сложное планирование и рассуждение, а при отключении работает быстрее для простых задач.

MiniMax также пообещала выпустить M3 в формате open weights в течение 10 дней. Это означает, что компании смогут скачать веса модели и разворачивать ее в собственной инфраструктуре. Однако точная лицензия пока не раскрыта, поэтому неясно, какие ограничения будут действовать для коммерческого использования.