OpenAI представила ИИ-агента, который может кодить сутками

Компания выпустила GPT-5.1-Codex-Max — обновленную версию своего агентного программиста, рассчитанную на сложные инженерные задачи, которые требуют часов или даже суток непрерывной работы. Модель заменяет прежний GPT-5.1-Codex и становится стандартом во всех интерфейсах Codex.

Оставить комментарий

По данным компании, Codex-Max существенно увеличил качество и стабильность длинных сессий благодаря новой системе compaction: автоматическому сжатию истории, когда контекстное окно заполняется. Модель сохраняет ключевые шаги и отбрасывает нерелевантные детали, что позволяет ей работать с миллионами токенов в рамках одной задачи и удерживать фокус более 24 часов.

OpenAI подчеркивает, что Codex-Max создан специально для «длительной, детальной работы», включая устранение тестовых ошибок, рефакторинг или итеративную разработку. Внутренние тесты показывают, что Codex-Max использует на 30% меньше thinking-токенов, работает на 27–42% быстрее, генерирует меньше строк кода при том же качестве и улучшает результаты на ряде инженерных бенчмарков.

В тесте SWE-Bench Verified модель достигает 77,9%, что выше результатов конкурентов — Google Gemini 3 и Anthropic. На внутренних бенчмарках OpenAI показатель вырос с 66,3% до 79,9%. Codex-Max позиционируется как самый продвинутый в линейке OpenAI инструмент для кибербезопасности, хотя компания подчеркивает, что он не достигает уровня High Capability и требует обязательной проверки человеком.

Компания предупреждает: чем длиннее задачи Codex, тем критичнее аудит кода: «По мере увеличения объема работы разработчикам нужно особенно тщательно проверять результат — иначе ошибка модели может поглотить выгоды автоматизации».

Модель уже доступна пользователям ChatGPT Plus, Pro, Team, Edu и Enterprise. API-доступ появится позже. У пользователей Plus лимиты составляют 45–225 локальных задач и 10–60 облачных задач на 5 часов. У Pro — значительно выше, до 1500 локальных и 400 облачных задач.

Главный ИИ-учёный уходит из Meta, чтобы создать свой стартап
По теме
Главный ИИ-учёный уходит из Meta, чтобы создать свой стартап
CEO Instagram: успех в ИИ дают два качества — и диплом тут ни при чём
По теме
CEO Instagram: успех в ИИ дают два качества — и диплом тут ни при чём
Китайская Ant Group показала ИИ, который создаёт приложения за 30 секунд
По теме
Китайская Ant Group показала ИИ, который создаёт приложения за 30 секунд

Читать на dev.by