«Лучший в мире ИИ для кодинга» от Anthropic работает автономно до 30 часов
Anthropic запустила модель Claude Sonnet 4.5, которую компания называет «лучшей моделью для программирования в мире». По словам разработчиков, ИИ способен создавать не просто прототипы, а готовые приложения.
Anthropic запустила модель Claude Sonnet 4.5, которую компания называет «лучшей моделью для программирования в мире». По словам разработчиков, ИИ способен создавать не просто прототипы, а готовые приложения.
Claude Sonnet 4.5 доступен через Claude API и в чатботе Claude по прежней цене: $3 за миллион входных токенов и $15 за миллион выходных. Модель ориентирована прежде всего на задачи программирования, кибербезопасности, финансов и научных исследований.
Anthropic утверждает, что Sonnet 4.5 лидирует в отраслевых бенчмарках, включая SWE-Bench Verified. При тестах ИИ мог автономно работать до 30 часов подряд: создавать приложения, запускать базы данных, покупать домены и даже проходить аудит безопасности SOC 2.
Точность ИИ-моделей в задачах программирования (SWE-bench Verified). Источник: Anthropic.
Руководители стартапов Cursor и Windsurf, активно сотрудничающих с Anthropic, заявили, что Claude Sonnet 4.5 задает новый уровень качества для задач с длинным горизонтом планирования.
Новая модель стала более устойчива к атакам с использованием prompt injection и реже демонстрирует «нежелательное поведение» вроде льстивости или искажения информации. По словам сооснователя Anthropic Джареда Каплана, это «самый серьезный прогресс в сфере безопасности ИИ за последние полтора года».
Сравнение ИИ-моделей по ключевым метрикам. Источник: Anthropic.
Одновременно с релизом Anthropic представила Claude Agent SDK — инфраструктуру, на которой работает Claude Code, доступную теперь сторонним разработчикам для создания собственных ИИ-агентов. Кроме того, подписчики уровня Max получили доступ к экспериментальному режиму Imagine with Claude, позволяющему в реальном времени генерировать программное обеспечение «с нуля».
Запуск Sonnet 4.5 демонстрирует высокую скорость обновлений в индустрии: модель вышла менее чем через два месяца после релиза Claude Opus 4.1 и всего через четыре месяца после Claude Sonnet 4. Компания уже намекнула, что до конца года могут состояться еще один-два релиза.
Помучил Клода 4 конвертацией Gradle скриптов из Groovy на Kotlin. Так само полностью рабочий код и не выдало или устаревшие функции выдает, или (как всегда) генерирует использование несуществующих классов. Даже от китайского DeepSeek больше пользы.
DeepSeek вообще печально работает. У китайцев неплохо получаются модели для zero-shot: Qwen 3 и Kimi с такими вполне неплохо справляются. Но когда контекст разрастается до 4-5 вопросов - начинают галлюцинировать. Пробовал сегодня этот Sonnet 4.5 - по сравнению с другим сонетами, конечно, лучше, но до Opus 4.0 thinking - не дотягивает. По крайней мере в моём скоупе задач.
Просто нужно иметь больше желания получить результат, чем завалить. Можно, например, сделать гайд по миграции конфигов с груви на котлин и дать его модели вместе с задачей. Можно дать примеры уже смигированных конфигов. Можно мигрировать частями. Можно дать какие-нибудь инструменты поиска документации, а не надеяться, что оно знает Gradle Kotlin DLS нужной версии. Ну, и может быть так, что конкретно эта задача по какой-то причине не годится для ИИ.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
Помучил Клода 4 конвертацией Gradle скриптов из Groovy на Kotlin. Так само полностью рабочий код и не выдало или устаревшие функции выдает, или (как всегда) генерирует использование несуществующих классов. Даже от китайского DeepSeek больше пользы.
DeepSeek вообще печально работает. У китайцев неплохо получаются модели для zero-shot: Qwen 3 и Kimi с такими вполне неплохо справляются. Но когда контекст разрастается до 4-5 вопросов - начинают галлюцинировать. Пробовал сегодня этот Sonnet 4.5 - по сравнению с другим сонетами, конечно, лучше, но до Opus 4.0 thinking - не дотягивает. По крайней мере в моём скоупе задач.
Просто нужно иметь больше желания получить результат, чем завалить. Можно, например, сделать гайд по миграции конфигов с груви на котлин и дать его модели вместе с задачей. Можно дать примеры уже смигированных конфигов. Можно мигрировать частями. Можно дать какие-нибудь инструменты поиска документации, а не надеяться, что оно знает Gradle Kotlin DLS нужной версии. Ну, и может быть так, что конкретно эта задача по какой-то причине не годится для ИИ.