Дапамажыце dev.by 🤍
Падтрымаць

«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін

Anthropic запусціла мадэль Claude Sonnet 4.5, якую кампанія называе «лепшай мадэллю для праграмавання ў свеце». Па словах распрацоўшчыкаў, ШІ здольны ствараць не проста прататыпы, а гатовыя аплікацыі.

3 каментарыя
«Лепшы ў свеце ШІ для кодынгу» ад Anthropic працуе аўтаномна да 30 гадзін

Anthropic запусціла мадэль Claude Sonnet 4.5, якую кампанія называе «лепшай мадэллю для праграмавання ў свеце». Па словах распрацоўшчыкаў, ШІ здольны ствараць не проста прататыпы, а гатовыя аплікацыі.

Claude Sonnet 4.5 даступны праз Claude API і ў чатбоце Claude па ранейшай цане: $3 за мільён уваходных токенаў і $15 за мільён выхадных. Мадэль арыентавана перш за ўсё на задачы праграмавання, кібербяспекі, фінансаў і навуковых даследаванняў.

Anthropic сцвярджае, што Sonnet 4.5 лідзіруе ў галіновых бенчмарках, уключаючы SWE-Bench Verified. Пры тэстах ШІ мог аўтаномна працаваць да 30 гадзін запар: ствараць аплікацыі, запускаць базы дадзеных, купляць дамены і нават праходзіць аўдыт бяспекі SOC 2.

Дакладнасць ШІ-мадэляў у задачах праграмавання (SWE-bench Verified). Крыніца: Anthropic.

Кіраўнікі стартапаў Cursor і Windsurf, якія актыўна супрацоўнічаюць з Anthropic, заявілі, што Claude Sonnet 4.5 задае новы ўзровень якасці для задач з доўгім гарызонтам планавання.

Новая мадэль стала больш устойлівай да атак з выкарыстаннем prompt injection і радзей дэманструе «непажаданыя паводзіны» накшталт ліслівасці ці скажэння інфармацыі. Па словах сузаснавальніка Anthropic Джарэда Каплана, гэта «самы сур’ёзны прагрэс у сферы бяспекі ШІ за апошнія паўтара года».

Параўнанне ШІ-мадэляў па ключавых метрыках. Крыніца: Anthropic.

Адначасова з рэлізам Anthropic прэзентавала Claude Agent SDK — інфраструктуру, на якой працуе Claude Code, даступную цяпер пабочным распрацоўшчыкам для стварэння ўласных ШІ-агентаў. Акрамя таго, падпісчыкі ўзроўню Max атрымалі доступ да эксперыментальнага рэжыму Imagine with Claude, які дазваляе ў рэальным часе генераваць праграмнае забеспячэнне «з нуля».

Запуск Sonnet 4.5 дэманструе высокую хуткасць абнаўленняў у індустрыі: мадэль выйшла менш чым праз два месяцы пасля рэліза Claude Opus 4.1 і ўсяго праз чатыры месяцы пасля Claude Sonnet 4. Кампанія ўжо зрабіла намёк, што да канца года могуць адбыцца яшчэ адзін-два рэлізы.

9 з 10 праграмістаў ужо пішуць код з дапамогай ШІ але не давяраюць яму
9 з 10 праграмістаў ужо пішуць код з дапамогай ШІ, але не давяраюць яму
Па тэме
9 з 10 праграмістаў ужо пішуць код з дапамогай ШІ, але не давяраюць яму
ШІ-рэдактар кода Cursor запусціў бясплатны курс для распрацоўшчыкаў
ШІ-рэдактар кода Cursor запусціў бясплатны курс для распрацоўшчыкаў
Па тэме
ШІ-рэдактар кода Cursor запусціў бясплатны курс для распрацоўшчыкаў
Meta прэзентавала ШІ які не толькі піша але і «разумее» код
Meta прэзентавала ШІ, які не толькі піша, але і «разумее» код
Па тэме
Meta прэзентавала ШІ, які не толькі піша, але і «разумее» код
Чытайце таксама
ШІ робіць сур'ёзныя памылкі ў навінах у палове выпадкаў
ШІ робіць сур'ёзныя памылкі ў навінах у палове выпадкаў
ШІ робіць сур'ёзныя памылкі ў навінах у палове выпадкаў
ШІ прывёў да буму найму Salesforce. Але толькі ў адной сферы
ШІ прывёў да буму найму Salesforce. Але толькі ў адной сферы
ШІ прывёў да буму найму Salesforce. Але толькі ў адной сферы
МТС запусціў ШІ-асістэнта. Вось колькі каштуе
МТС запусціў ШІ-асістэнта. Вось колькі каштуе
МТС запусціў ШІ-асістэнта. Вось колькі каштуе
1 каментарый
OpenAI прэзентавала ШІ-браўзэр Atlas — з убудаваным ChatGPT
OpenAI прэзентавала ШІ-браўзэр Atlas — з убудаваным ChatGPT
OpenAI прэзентавала ШІ-браўзэр Atlas — з убудаваным ChatGPT

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

0

Помучил Клода 4 конвертацией Gradle скриптов из Groovy на Kotlin. Так само полностью рабочий код и не выдало или устаревшие функции выдает, или (как всегда) генерирует использование несуществующих классов. Даже от китайского DeepSeek больше пользы.

Zhan Chubukou
Zhan Chubukou Шчолкаю зубамі в ЗАО "Прыдацелі і атшчыпенцы"
0

DeepSeek вообще печально работает. У китайцев неплохо получаются модели для zero-shot: Qwen 3 и Kimi с такими вполне неплохо справляются. Но когда контекст разрастается до 4-5 вопросов - начинают галлюцинировать. Пробовал сегодня этот Sonnet 4.5 - по сравнению с другим сонетами, конечно, лучше, но до Opus 4.0 thinking - не дотягивает. По крайней мере в моём скоупе задач.

0

Просто нужно иметь больше желания получить результат, чем завалить. Можно, например, сделать гайд по миграции конфигов с груви на котлин и дать его модели вместе с задачей. Можно дать примеры уже смигированных конфигов. Можно мигрировать частями. Можно дать какие-нибудь инструменты поиска документации, а не надеяться, что оно знает Gradle Kotlin DLS нужной версии. Ну, и может быть так, что конкретно эта задача по какой-то причине не годится для ИИ.