OpenAI прэзентавала ШІ-агента, які можа кадаваць суткамі

Кампанія выпусціла GPT-5.1-Codex-Max — абноўленую версію свайго агентнага праграміста, разлічаную на складаныя інжынерныя задачы, якія патрабуюць гадзін або нават сутак бесперапыннай працы. Мадэль замяняе ранейшы GPT-5.1-Codex і робіцца стандартам ва ўсіх інтэрфейсах Codex.

Пакінуць каментарый

Паводле дадзеных кампаніі, Codex-Max істотна павялічыў якасць і стабільнасць доўгіх сесій дзякуючы новай сістэме compaction: аўтаматычнаму сцісканню гісторыі, калі кантэкстнае акно запаўняецца. Мадэль захоўвае ключавыя крокі і адкідвае нерэлевантныя дэталі, што дазваляе ёй працаваць з мільёнамі токенаў у рамках адной задачы і ўтрымліваць фокус больш за 24 гадзіны.

OpenAI падкрэслівае, што Codex-Max створаны адмыслова для «працяглай, дэталёвай працы», уключаючы ліквідацыю тэставых памылак, рэфактарынг ці ітэратыўную распрацоўку. Унутраныя тэсты паказваюць, што Codex-Max выкарыстоўвае на 30% менш thinking-токенаў, працуе на 27-42% хутчэй, генеруе менш радкоў кода пры той жа якасці і паляпшае вынікі на шэрагу інжынерных бенчмаркаў.

У тэсце SWE-Bench Verified мадэль дасягае 77,9%, што вышэй за вынікі канкурэнтаў — Google Gemini 3 і Anthropic. На ўнутраных бенчмарках OpenAI паказчык вырас з 66,3% да 79,9%. Codex-Max пазіцыянуецца як самы прасунуты ў лінейцы OpenAI інструмент для кібербяспекі, хаця кампанія падкрэслівае, што ён не дасягае ўзроўню High Capability і патрабуе абавязковай праверкі чалавекам.

Кампанія папярэджвае: чым даўжэйшыя задачы Codex, тым крытычней аўдыт кода: «Па меры павелічэння аб’ёму працы распрацоўшчыкам трэба асабліва старанна правяраць вынік — інакш памылка мадэлі можа паглынуць выгады аўтаматызацыі».

Мадэль ужо даступная карыстальнікам ChatGPT Plus, Pro, Team, Edu і Enterprise. API-доступ з’явіцца пазней. У карыстальнікаў Plus ліміты складаюць 45-225 лакальных задач і 10-60 воблачных задач на 5 гадзін. У Pro — значна вышэй, да 1500 лакальных і 400 воблачных задач.

Галоўны ШІ-навуковец сыходзіць з Meta, каб стварыць уласны стартап
Па тэме
Галоўны ШІ-навуковец сыходзіць з Meta, каб стварыць уласны стартап
Кіраўнік Instagram: поспех у ШІ забяспечваюць дзве якасці — і дыплом тут ні пры чым
Па тэме
Кіраўнік Instagram: поспех у ШІ забяспечваюць дзве якасці — і дыплом тут ні пры чым
Кітайская Ant Group паказала ШІ, які стварае аплікацыі за 30 секунд
Па тэме
Кітайская Ant Group паказала ШІ, які стварае аплікацыі за 30 секунд

Читать на dev.by