17% скидка на размещение рекламы на площадках devby — до 20 ноября. Клац!
Support us

«Лучший в мире ИИ для кодинга» от Anthropic работает автономно до 30 часов

Anthropic запустила модель Claude Sonnet 4.5, которую компания называет «лучшей моделью для программирования в мире». По словам разработчиков, ИИ способен создавать не просто прототипы, а готовые приложения.

3 комментария
«Лучший в мире ИИ для кодинга» от Anthropic работает автономно до 30 часов

Anthropic запустила модель Claude Sonnet 4.5, которую компания называет «лучшей моделью для программирования в мире». По словам разработчиков, ИИ способен создавать не просто прототипы, а готовые приложения.

Claude Sonnet 4.5 доступен через Claude API и в чатботе Claude по прежней цене: $3 за миллион входных токенов и $15 за миллион выходных. Модель ориентирована прежде всего на задачи программирования, кибербезопасности, финансов и научных исследований.

Anthropic утверждает, что Sonnet 4.5 лидирует в отраслевых бенчмарках, включая SWE-Bench Verified. При тестах ИИ мог автономно работать до 30 часов подряд: создавать приложения, запускать базы данных, покупать домены и даже проходить аудит безопасности SOC 2.

Точность ИИ-моделей в задачах программирования (SWE-bench Verified). Источник: Anthropic.

Руководители стартапов Cursor и Windsurf, активно сотрудничающих с Anthropic, заявили, что Claude Sonnet 4.5 задает новый уровень качества для задач с длинным горизонтом планирования.

Новая модель стала более устойчива к атакам с использованием prompt injection и реже демонстрирует «нежелательное поведение» вроде льстивости или искажения информации. По словам сооснователя Anthropic Джареда Каплана, это «самый серьезный прогресс в сфере безопасности ИИ за последние полтора года».

Сравнение ИИ-моделей по ключевым метрикам. Источник: Anthropic.

Одновременно с релизом Anthropic представила Claude Agent SDK — инфраструктуру, на которой работает Claude Code, доступную теперь сторонним разработчикам для создания собственных ИИ-агентов. Кроме того, подписчики уровня Max получили доступ к экспериментальному режиму Imagine with Claude, позволяющему в реальном времени генерировать программное обеспечение «с нуля».

Запуск Sonnet 4.5 демонстрирует высокую скорость обновлений в индустрии: модель вышла менее чем через два месяца после релиза Claude Opus 4.1 и всего через четыре месяца после Claude Sonnet 4. Компания уже намекнула, что до конца года могут состояться еще один-два релиза.

9 из 10 программистов уже пишут код с ИИ но не доверяют ему
9 из 10 программистов уже пишут код с ИИ, но не доверяют ему
По теме
9 из 10 программистов уже пишут код с ИИ, но не доверяют ему
ИИ-редактор кода Cursor запустил бесплатный курс для разработчиков
ИИ-редактор кода Cursor запустил бесплатный курс для разработчиков
По теме
ИИ-редактор кода Cursor запустил бесплатный курс для разработчиков
Meta представила ИИ который не только пишет но и «понимает» код
Meta представила ИИ, который не только пишет, но и «понимает» код
По теме
Meta представила ИИ, который не только пишет, но и «понимает» код
Читайте также
В ChatGPT появились групповые чаты
В ChatGPT появились групповые чаты
В ChatGPT появились групповые чаты
1 комментарий
«Крёстная мать ИИ»: настоящий прорыв начнётся, когда ИИ научится понимать пространство
«Крёстная мать ИИ»: настоящий прорыв начнётся, когда ИИ научится понимать пространство
«Крёстная мать ИИ»: настоящий прорыв начнётся, когда ИИ научится понимать пространство
ИИ не умеет быть токсичным, чтобы сойти за человека
ИИ не умеет быть токсичным, чтобы сойти за человека
ИИ не умеет быть токсичным, чтобы сойти за человека
Первый российский ИИ-робот дебютировал лицом в пол
Первый российский ИИ-робот дебютировал лицом в пол
Первый российский ИИ-робот дебютировал лицом в пол
5 комментариев

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

0

Помучил Клода 4 конвертацией Gradle скриптов из Groovy на Kotlin. Так само полностью рабочий код и не выдало или устаревшие функции выдает, или (как всегда) генерирует использование несуществующих классов. Даже от китайского DeepSeek больше пользы.

Zhan Chubukou
Zhan Chubukou Шчолкаю зубамі в ЗАО "Прыдацелі і атшчыпенцы"
0

DeepSeek вообще печально работает. У китайцев неплохо получаются модели для zero-shot: Qwen 3 и Kimi с такими вполне неплохо справляются. Но когда контекст разрастается до 4-5 вопросов - начинают галлюцинировать. Пробовал сегодня этот Sonnet 4.5 - по сравнению с другим сонетами, конечно, лучше, но до Opus 4.0 thinking - не дотягивает. По крайней мере в моём скоупе задач.

0

Просто нужно иметь больше желания получить результат, чем завалить. Можно, например, сделать гайд по миграции конфигов с груви на котлин и дать его модели вместе с задачей. Можно дать примеры уже смигированных конфигов. Можно мигрировать частями. Можно дать какие-нибудь инструменты поиска документации, а не надеяться, что оно знает Gradle Kotlin DLS нужной версии. Ну, и может быть так, что конкретно эта задача по какой-то причине не годится для ИИ.