Anthropic выпусціла «лепшую мадэль для кодынгу ў свеце»
Anthropic прэзентавала агентную мадэль Claude Opus 4.5, якую называе «лепшай у свеце» для напісання кода, выканання офісных задач і ўзаемадзеяння з камп’ютарам.
Распрацоўшчыкі сцвярджаюць, што ў некаторых катэгорыях праграмавання яна перасягнула Gemini 3, пасля рэлізу якой рынкавая капіталізацыя Google абнавіла гістарычны рэкорд. Opus 4.5 лепш за сваіх папярэдніц праводзіць глыбокія даследаванні, працуе з прэзентацыямі і табліцамі. Яна паказала выдатныя вынікі на бенчмарках для кодынгу (SWE-Bench, Terminal-bench), на выкарыстанне інструментаў (tau2-bench, MCP Atlas), а таксама на агульных ARC-AGI 2 і GPQA Diamond.
Таксама пашырэнне Claude for Chrome стала даступна ўладальнікам падпіскі Max, якія працуюць у браўзеры Google, а для ўсіх платных падпісчыкаў з’явілася функцыя бязмежнага чату — бот больш не будзе выдаваць памылкі з-за перапаўнення кантэкстнага акна і зможа лепш забяспечыць узгодненасць файлаў і чатаў. Таксама Opus 4.5 стала лепшай у агенцкіх сцэнарыях і самастойным удасканаленні сваіх працэсаў. Акрамя таго, распрацоўшчыкі называюць Opus 4.5 сваёй самай бяспечнай мадэллю. Яна супрацьстаіць укараненню шкоднасных промптаў нават лепш за Gemini 3 Pro.
Апрабаваць Opus 4.5 можна ў праграмах Anthropic, праз API-інтэрфейс кампаніі і на трох найбуйнейшых воблачных платформах. Для распрацоўшчыкаў тарыф — $5 і $25 за мільён токенаў на ўвод і вывад.
Читать на dev.by