OpenAI представила ИИ-агента, который может кодить сутками
Компания выпустила GPT-5.1-Codex-Max — обновленную версию своего агентного программиста, рассчитанную на сложные инженерные задачи, которые требуют часов или даже суток непрерывной работы. Модель заменяет прежний GPT-5.1-Codex и становится стандартом во всех интерфейсах Codex.
По данным компании, Codex-Max существенно увеличил качество и стабильность длинных сессий благодаря новой системе compaction: автоматическому сжатию истории, когда контекстное окно заполняется. Модель сохраняет ключевые шаги и отбрасывает нерелевантные детали, что позволяет ей работать с миллионами токенов в рамках одной задачи и удерживать фокус более 24 часов.
OpenAI подчеркивает, что Codex-Max создан специально для «длительной, детальной работы», включая устранение тестовых ошибок, рефакторинг или итеративную разработку. Внутренние тесты показывают, что Codex-Max использует на 30% меньше thinking-токенов, работает на 27–42% быстрее, генерирует меньше строк кода при том же качестве и улучшает результаты на ряде инженерных бенчмарков.
В тесте SWE-Bench Verified модель достигает 77,9%, что выше результатов конкурентов — Google Gemini 3 и Anthropic. На внутренних бенчмарках OpenAI показатель вырос с 66,3% до 79,9%. Codex-Max позиционируется как самый продвинутый в линейке OpenAI инструмент для кибербезопасности, хотя компания подчеркивает, что он не достигает уровня High Capability и требует обязательной проверки человеком.
Компания предупреждает: чем длиннее задачи Codex, тем критичнее аудит кода: «По мере увеличения объема работы разработчикам нужно особенно тщательно проверять результат — иначе ошибка модели может поглотить выгоды автоматизации».
Модель уже доступна пользователям ChatGPT Plus, Pro, Team, Edu и Enterprise. API-доступ появится позже. У пользователей Plus лимиты составляют 45–225 локальных задач и 10–60 облачных задач на 5 часов. У Pro — значительно выше, до 1500 локальных и 400 облачных задач.
Читать на dev.by