«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін
Anthropic запусціла мадэль Claude Sonnet 4.5, якую кампанія называе «лепшай мадэллю для праграмавання ў свеце». Па словах распрацоўшчыкаў, ШІ здольны ствараць не проста прататыпы, а гатовыя аплікацыі.
Claude Sonnet 4.5 даступны праз Claude API і ў чатбоце Claude па ранейшай цане: $3 за мільён уваходных токенаў і $15 за мільён выхадных. Мадэль арыентавана перш за ўсё на задачы праграмавання, кібербяспекі, фінансаў і навуковых даследаванняў.
Anthropic сцвярджае, што Sonnet 4.5 лідзіруе ў галіновых бенчмарках, уключаючы SWE-Bench Verified. Пры тэстах ШІ мог аўтаномна працаваць да 30 гадзін запар: ствараць аплікацыі, запускаць базы дадзеных, купляць дамены і нават праходзіць аўдыт бяспекі SOC 2.
Кіраўнікі стартапаў Cursor і Windsurf, якія актыўна супрацоўнічаюць з Anthropic, заявілі, што Claude Sonnet 4.5 задае новы ўзровень якасці для задач з доўгім гарызонтам планавання.
Новая мадэль стала больш устойлівай да атак з выкарыстаннем prompt injection і радзей дэманструе «непажаданыя паводзіны» накшталт ліслівасці ці скажэння інфармацыі. Па словах сузаснавальніка Anthropic Джарэда Каплана, гэта «самы сур’ёзны прагрэс у сферы бяспекі ШІ за апошнія паўтара года».
Адначасова з рэлізам Anthropic прэзентавала Claude Agent SDK — інфраструктуру, на якой працуе Claude Code, даступную цяпер пабочным распрацоўшчыкам для стварэння ўласных ШІ-агентаў. Акрамя таго, падпісчыкі ўзроўню Max атрымалі доступ да эксперыментальнага рэжыму Imagine with Claude, які дазваляе ў рэальным часе генераваць праграмнае забеспячэнне «з нуля».
Запуск Sonnet 4.5 дэманструе высокую хуткасць абнаўленняў у індустрыі: мадэль выйшла менш чым праз два месяцы пасля рэліза Claude Opus 4.1 і ўсяго праз чатыры месяцы пасля Claude Sonnet 4. Кампанія ўжо зрабіла намёк, што да канца года могуць адбыцца яшчэ адзін-два рэлізы.
Читать на dev.by