Дапамажыце dev.by 🤍
Падтрымаць

«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін

Anthropic запусціла мадэль Claude Sonnet 4.5, якую кампанія называе «лепшай мадэллю для праграмавання ў свеце». Па словах распрацоўшчыкаў, ШІ здольны ствараць не проста прататыпы, а гатовыя аплікацыі.

3 каментарыя
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін

Anthropic запусціла мадэль Claude Sonnet 4.5, якую кампанія называе «лепшай мадэллю для праграмавання ў свеце». Па словах распрацоўшчыкаў, ШІ здольны ствараць не проста прататыпы, а гатовыя аплікацыі.

Claude Sonnet 4.5 даступны праз Claude API і ў чатбоце Claude па ранейшай цане: $3 за мільён уваходных токенаў і $15 за мільён выхадных. Мадэль арыентавана перш за ўсё на задачы праграмавання, кібербяспекі, фінансаў і навуковых даследаванняў.

Anthropic сцвярджае, што Sonnet 4.5 лідзіруе ў галіновых бенчмарках, уключаючы SWE-Bench Verified. Пры тэстах ШІ мог аўтаномна працаваць да 30 гадзін запар: ствараць аплікацыі, запускаць базы дадзеных, купляць дамены і нават праходзіць аўдыт бяспекі SOC 2.

Дакладнасць ШІ-мадэляў у задачах праграмавання (SWE-bench Verified). Крыніца: Anthropic.

Кіраўнікі стартапаў Cursor і Windsurf, якія актыўна супрацоўнічаюць з Anthropic, заявілі, што Claude Sonnet 4.5 задае новы ўзровень якасці для задач з доўгім гарызонтам планавання.

Новая мадэль стала больш устойлівай да атак з выкарыстаннем prompt injection і радзей дэманструе «непажаданыя паводзіны» накшталт ліслівасці ці скажэння інфармацыі. Па словах сузаснавальніка Anthropic Джарэда Каплана, гэта «самы сур’ёзны прагрэс у сферы бяспекі ШІ за апошнія паўтара года».

Параўнанне ШІ-мадэляў па ключавых метрыках. Крыніца: Anthropic.

Адначасова з рэлізам Anthropic прэзентавала Claude Agent SDK — інфраструктуру, на якой працуе Claude Code, даступную цяпер пабочным распрацоўшчыкам для стварэння ўласных ШІ-агентаў. Акрамя таго, падпісчыкі ўзроўню Max атрымалі доступ да эксперыментальнага рэжыму Imagine with Claude, які дазваляе ў рэальным часе генераваць праграмнае забеспячэнне «з нуля».

Запуск Sonnet 4.5 дэманструе высокую хуткасць абнаўленняў у індустрыі: мадэль выйшла менш чым праз два месяцы пасля рэліза Claude Opus 4.1 і ўсяго праз чатыры месяцы пасля Claude Sonnet 4. Кампанія ўжо зрабіла намёк, што да канца года могуць адбыцца яшчэ адзін-два рэлізы.

9 з 10 праграмістаў ужо пішуць код з дапамогай ШІ але не давяраюць яму
9 з 10 праграмістаў ужо пішуць код з дапамогай ШІ, але не давяраюць яму
Па тэме
9 з 10 праграмістаў ужо пішуць код з дапамогай ШІ, але не давяраюць яму
ШІ-рэдактар кода Cursor запусціў бясплатны курс для распрацоўшчыкаў
ШІ-рэдактар кода Cursor запусціў бясплатны курс для распрацоўшчыкаў
Па тэме
ШІ-рэдактар кода Cursor запусціў бясплатны курс для распрацоўшчыкаў
Meta прэзентавала ШІ які не толькі піша але і «разумее» код
Meta прэзентавала ШІ, які не толькі піша, але і «разумее» код
Па тэме
Meta прэзентавала ШІ, які не толькі піша, але і «разумее» код
Чытайце таксама
У ChatGPT з'явіліся групавыя чаты
У ChatGPT з'явіліся групавыя чаты
У ChatGPT з'явіліся групавыя чаты
1 каментарый
«Хросная маці ШІ»: сапраўдны прарыў пачнецца, калі ШІ навучыцца разумець прастору
«Хросная маці ШІ»: сапраўдны прарыў пачнецца, калі ШІ навучыцца разумець прастору
«Хросная маці ШІ»: сапраўдны прарыў пачнецца, калі ШІ навучыцца разумець прастору
ШІ не ўмее быць таксічным, каб выдаць сябе за чалавека
ШІ не ўмее быць таксічным, каб выдаць сябе за чалавека
ШІ не ўмее быць таксічным, каб выдаць сябе за чалавека
Першы расійскі ШІ-робат дэбютаваў тварам у падлогу
Першы расійскі ШІ-робат дэбютаваў тварам у падлогу
Першы расійскі ШІ-робат дэбютаваў тварам у падлогу
4 каментарыя

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

0

Помучил Клода 4 конвертацией Gradle скриптов из Groovy на Kotlin. Так само полностью рабочий код и не выдало или устаревшие функции выдает, или (как всегда) генерирует использование несуществующих классов. Даже от китайского DeepSeek больше пользы.

Zhan Chubukou
Zhan Chubukou Шчолкаю зубамі в ЗАО "Прыдацелі і атшчыпенцы"
0

DeepSeek вообще печально работает. У китайцев неплохо получаются модели для zero-shot: Qwen 3 и Kimi с такими вполне неплохо справляются. Но когда контекст разрастается до 4-5 вопросов - начинают галлюцинировать. Пробовал сегодня этот Sonnet 4.5 - по сравнению с другим сонетами, конечно, лучше, но до Opus 4.0 thinking - не дотягивает. По крайней мере в моём скоупе задач.

0

Просто нужно иметь больше желания получить результат, чем завалить. Можно, например, сделать гайд по миграции конфигов с груви на котлин и дать его модели вместе с задачей. Можно дать примеры уже смигированных конфигов. Можно мигрировать частями. Можно дать какие-нибудь инструменты поиска документации, а не надеяться, что оно знает Gradle Kotlin DLS нужной версии. Ну, и может быть так, что конкретно эта задача по какой-то причине не годится для ИИ.