«Лучший в мире ИИ для кодинга» от Anthropic работает автономно до 30 часов

Anthropic запустила модель Claude Sonnet 4.5, которую компания называет «лучшей моделью для программирования в мире». По словам разработчиков, ИИ способен создавать не просто прототипы, а готовые приложения.

Оставить комментарий

Claude Sonnet 4.5 доступен через Claude API и в чатботе Claude по прежней цене: $3 за миллион входных токенов и $15 за миллион выходных. Модель ориентирована прежде всего на задачи программирования, кибербезопасности, финансов и научных исследований.

Anthropic утверждает, что Sonnet 4.5 лидирует в отраслевых бенчмарках, включая SWE-Bench Verified. При тестах ИИ мог автономно работать до 30 часов подряд: создавать приложения, запускать базы данных, покупать домены и даже проходить аудит безопасности SOC 2.

Точность ИИ-моделей в задачах программирования (SWE-bench Verified). Источник: Anthropic.

Руководители стартапов Cursor и Windsurf, активно сотрудничающих с Anthropic, заявили, что Claude Sonnet 4.5 задает новый уровень качества для задач с длинным горизонтом планирования.

Новая модель стала более устойчива к атакам с использованием prompt injection и реже демонстрирует «нежелательное поведение» вроде льстивости или искажения информации. По словам сооснователя Anthropic Джареда Каплана, это «самый серьезный прогресс в сфере безопасности ИИ за последние полтора года».

Сравнение ИИ-моделей по ключевым метрикам. Источник: Anthropic.

Одновременно с релизом Anthropic представила Claude Agent SDK — инфраструктуру, на которой работает Claude Code, доступную теперь сторонним разработчикам для создания собственных ИИ-агентов. Кроме того, подписчики уровня Max получили доступ к экспериментальному режиму Imagine with Claude, позволяющему в реальном времени генерировать программное обеспечение «с нуля».

Запуск Sonnet 4.5 демонстрирует высокую скорость обновлений в индустрии: модель вышла менее чем через два месяца после релиза Claude Opus 4.1 и всего через четыре месяца после Claude Sonnet 4. Компания уже намекнула, что до конца года могут состояться еще один-два релиза.

9 из 10 программистов уже пишут код с ИИ, но не доверяют ему
По теме
9 из 10 программистов уже пишут код с ИИ, но не доверяют ему
ИИ-редактор кода Cursor запустил бесплатный курс для разработчиков
По теме
ИИ-редактор кода Cursor запустил бесплатный курс для разработчиков
Meta представила ИИ, который не только пишет, но и «понимает» код
По теме
Meta представила ИИ, который не только пишет, но и «понимает» код

Читать на dev.by