OpenAI прэзентавала ШІ-агента, які можа кадаваць суткамі
Кампанія выпусціла GPT-5.1-Codex-Max — абноўленую версію свайго агентнага праграміста, разлічаную на складаныя інжынерныя задачы, якія патрабуюць гадзін або нават сутак бесперапыннай працы. Мадэль замяняе ранейшы GPT-5.1-Codex і робіцца стандартам ва ўсіх інтэрфейсах Codex.
Паводле дадзеных кампаніі, Codex-Max істотна павялічыў якасць і стабільнасць доўгіх сесій дзякуючы новай сістэме compaction: аўтаматычнаму сцісканню гісторыі, калі кантэкстнае акно запаўняецца. Мадэль захоўвае ключавыя крокі і адкідвае нерэлевантныя дэталі, што дазваляе ёй працаваць з мільёнамі токенаў у рамках адной задачы і ўтрымліваць фокус больш за 24 гадзіны.
OpenAI падкрэслівае, што Codex-Max створаны адмыслова для «працяглай, дэталёвай працы», уключаючы ліквідацыю тэставых памылак, рэфактарынг ці ітэратыўную распрацоўку. Унутраныя тэсты паказваюць, што Codex-Max выкарыстоўвае на 30% менш thinking-токенаў, працуе на 27-42% хутчэй, генеруе менш радкоў кода пры той жа якасці і паляпшае вынікі на шэрагу інжынерных бенчмаркаў.
У тэсце SWE-Bench Verified мадэль дасягае 77,9%, што вышэй за вынікі канкурэнтаў — Google Gemini 3 і Anthropic. На ўнутраных бенчмарках OpenAI паказчык вырас з 66,3% да 79,9%. Codex-Max пазіцыянуецца як самы прасунуты ў лінейцы OpenAI інструмент для кібербяспекі, хаця кампанія падкрэслівае, што ён не дасягае ўзроўню High Capability і патрабуе абавязковай праверкі чалавекам.
Кампанія папярэджвае: чым даўжэйшыя задачы Codex, тым крытычней аўдыт кода: «Па меры павелічэння аб’ёму працы распрацоўшчыкам трэба асабліва старанна правяраць вынік — інакш памылка мадэлі можа паглынуць выгады аўтаматызацыі».
Мадэль ужо даступная карыстальнікам ChatGPT Plus, Pro, Team, Edu і Enterprise. API-доступ з’явіцца пазней. У карыстальнікаў Plus ліміты складаюць 45-225 лакальных задач і 10-60 воблачных задач на 5 гадзін. У Pro — значна вышэй, да 1500 лакальных і 400 воблачных задач.
Читать на dev.by