«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін

Anthropic запусціла мадэль Claude Sonnet 4.5, якую кампанія называе «лепшай мадэллю для праграмавання ў свеце». Па словах распрацоўшчыкаў, ШІ здольны ствараць не проста прататыпы, а гатовыя аплікацыі.

Пакінуць каментарый

Claude Sonnet 4.5 даступны праз Claude API і ў чатбоце Claude па ранейшай цане: $3 за мільён уваходных токенаў і $15 за мільён выхадных. Мадэль арыентавана перш за ўсё на задачы праграмавання, кібербяспекі, фінансаў і навуковых даследаванняў.

Anthropic сцвярджае, што Sonnet 4.5 лідзіруе ў галіновых бенчмарках, уключаючы SWE-Bench Verified. Пры тэстах ШІ мог аўтаномна працаваць да 30 гадзін запар: ствараць аплікацыі, запускаць базы дадзеных, купляць дамены і нават праходзіць аўдыт бяспекі SOC 2.

Дакладнасць ШІ-мадэляў у задачах праграмавання (SWE-bench Verified). Крыніца: Anthropic.

Кіраўнікі стартапаў Cursor і Windsurf, якія актыўна супрацоўнічаюць з Anthropic, заявілі, што Claude Sonnet 4.5 задае новы ўзровень якасці для задач з доўгім гарызонтам планавання.

Новая мадэль стала больш устойлівай да атак з выкарыстаннем prompt injection і радзей дэманструе «непажаданыя паводзіны» накшталт ліслівасці ці скажэння інфармацыі. Па словах сузаснавальніка Anthropic Джарэда Каплана, гэта «самы сур’ёзны прагрэс у сферы бяспекі ШІ за апошнія паўтара года».

Параўнанне ШІ-мадэляў па ключавых метрыках. Крыніца: Anthropic.

Адначасова з рэлізам Anthropic прэзентавала Claude Agent SDK — інфраструктуру, на якой працуе Claude Code, даступную цяпер пабочным распрацоўшчыкам для стварэння ўласных ШІ-агентаў. Акрамя таго, падпісчыкі ўзроўню Max атрымалі доступ да эксперыментальнага рэжыму Imagine with Claude, які дазваляе ў рэальным часе генераваць праграмнае забеспячэнне «з нуля».

Запуск Sonnet 4.5 дэманструе высокую хуткасць абнаўленняў у індустрыі: мадэль выйшла менш чым праз два месяцы пасля рэліза Claude Opus 4.1 і ўсяго праз чатыры месяцы пасля Claude Sonnet 4. Кампанія ўжо зрабіла намёк, што да канца года могуць адбыцца яшчэ адзін-два рэлізы.

9 з 10 праграмістаў ужо пішуць код з дапамогай ШІ, але не давяраюць яму
Па тэме
9 з 10 праграмістаў ужо пішуць код з дапамогай ШІ, але не давяраюць яму
ШІ-рэдактар кода Cursor запусціў бясплатны курс для распрацоўшчыкаў
Па тэме
ШІ-рэдактар кода Cursor запусціў бясплатны курс для распрацоўшчыкаў
Meta прэзентавала ШІ, які не толькі піша, але і «разумее» код
Па тэме
Meta прэзентавала ШІ, які не толькі піша, але і «разумее» код

Читать на dev.by