Anthropic выпусціла кодынг-мадэль, але спецыяльна абмежавала яе магчымасці
Кампанія прадставіла мадэль Claude Opus 4.7. У новай версіі ўзмацнілі магчымасці распрацоўкі і візуальнага аналізу, але пры гэтым свядома абмежавалі частку функцый у параўнанні з больш магутнай Claude Mythos.
Кампанія прадставіла мадэль Claude Opus 4.7. У новай версіі ўзмацнілі магчымасці распрацоўкі і візуальнага аналізу, але пры гэтым свядома абмежавалі частку функцый у параўнанні з больш магутнай Claude Mythos.
Паводле дадзеных кампаніі, Opus 4.7 стала значна лепшай у прасунутым праграмаванні, асабліва пры працы са складанымі і працяглымі задачамі. Мадэль дакладней выконвае інструкцыі, здольная самастойна правяраць вынікі і патрабуе менш кантролю з боку карыстальніка. У Anthropic адзначаюць, што цяпер ёй можна «упэўнена даручаць задачы, якія раней патрабавалі пастаяннага нагляду».
Сур’ёзна палепшыліся і мультымадальныя здольнасці. Мадэль лепш працуе з выявамі высокай і нізкай разрознасці (да 2576 пікселяў), дакладней дастае дадзеныя са складаных дыяграм і інтэрфейсаў, а таксама генеруе больш якасныя UI-макеты, прэзентацыі і дакументы.
Параўнанне Opus 4.7 з Opus 4.6, GPT-5.4, Gemini 3.1 Pro і Mythos: новая мадэль паляпшае паказчыкі, але саступае Mythos у ключавых задачах. Крыніца: Anthropic.
У тэстах Opus 4.7 паказала рост прыкладна на 10% у задачах агентнага праграмавання і на 13% у працы з візуальнымі ўваходнымі дадзенымі ў параўнанні з версіяй 4.6. У іншых бэнчмарках паляпшэнні больш умераныя, аднак мадэль дэманструе больш стабільныя паводзіны на доўгіх задачах і лепш спраўляецца з кантэкстам.
Асобны акцэнт зроблены на памяці: Opus 4.7 эфектыўней выкарыстоўвае файлавую памяць і можа захоўваць важныя дадзеныя паміж сесіямі, што спрашчае працу з доўгатэрміновымі праектамі і зніжае неабходнасць паўторна задаваць кантэкст.
Claude Opus 4.7 дэманструе рост дакладнасці ў задачах кодынгу ў параўнанні з версіяй 4.6, уключаючы шматмоўныя і мультымадальныя сцэнарыі. Крыніца: Anthropic.
Пры гэтым Anthropic указвае, што Opus 4.7 не з’яўляецца францірнай мадэллю кампаніі. Яе магчымасці ў галіне кібербяспекі і складанага праграмавання наўмысна зніжаны ў параўнанні з Claude Mythos. У працэсе навучання распрацоўшчыкі спецыяльна эксперыментавалі з абмежаваннем гэтых навыкаў.
Замест гэтага ў Opus 4.7 укаранёныя новыя ахоўныя механізмы: мадэль аўтаматычна распазнае і блакуе запыты, звязаныя з патэнцыйна небяспечнымі сцэнарыямі, напрыклад, узломам або шкоднасным выкарыстаннем кода.
Прадукцыйнасць Opus 4.7 расце з павелічэннем вылічальных рэсурсаў і стабільна апярэджвае Opus 4.6 на ўсіх узроўнях нагрузкі. Крыніца: Anthropic.
Claude Mythos, прадстаўленая раней, застаецца закрытай і даступная толькі абмежаванаму колу партнёраў, якія працуюць з крытычна важным ПЗ — сярод іх буйныя тэхналагічныя кампаніі і інфраструктурныя гульцы.
З пункту гледжання бяспекі Opus 4.7 дэманструе параўнальны профіль з версіяй 4.6: нізкі ўзровень непажаданых паводзін, уключаючы схільнасць да падману або выканання шкодных запытаў. У асобных аспектах, такіх як устойлівасць да промпт-ін’екцый і чэснасць, мадэль нават палепшылася, хоць у некаторых выпадках застаецца менш стабільнай.
Claude Opus 4.7 ужо даступная ва ўсіх прадуктах Anthropic, уключаючы API, а таксама праз воблачныя платформы Amazon Bedrock, Google Vertex AI і Microsoft Foundry. Кошт застаўся на ўзроўні папярэдняй версіі: $5 за мільён уваходных токенаў і $25 за мільён выходных.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.