devby 17 лет! Вспоминаем переходный возраст и делимся виш-листом
Support us

«Лучший в мире ИИ для кодинга» от Anthropic работает автономно до 30 часов

Anthropic запустила модель Claude Sonnet 4.5, которую компания называет «лучшей моделью для программирования в мире». По словам разработчиков, ИИ способен создавать не просто прототипы, а готовые приложения.

3 комментария
«Лучший в мире ИИ для кодинга» от Anthropic работает автономно до 30 часов

Anthropic запустила модель Claude Sonnet 4.5, которую компания называет «лучшей моделью для программирования в мире». По словам разработчиков, ИИ способен создавать не просто прототипы, а готовые приложения.

Claude Sonnet 4.5 доступен через Claude API и в чатботе Claude по прежней цене: $3 за миллион входных токенов и $15 за миллион выходных. Модель ориентирована прежде всего на задачи программирования, кибербезопасности, финансов и научных исследований.

Anthropic утверждает, что Sonnet 4.5 лидирует в отраслевых бенчмарках, включая SWE-Bench Verified. При тестах ИИ мог автономно работать до 30 часов подряд: создавать приложения, запускать базы данных, покупать домены и даже проходить аудит безопасности SOC 2.

Точность ИИ-моделей в задачах программирования (SWE-bench Verified). Источник: Anthropic.

Руководители стартапов Cursor и Windsurf, активно сотрудничающих с Anthropic, заявили, что Claude Sonnet 4.5 задает новый уровень качества для задач с длинным горизонтом планирования.

Новая модель стала более устойчива к атакам с использованием prompt injection и реже демонстрирует «нежелательное поведение» вроде льстивости или искажения информации. По словам сооснователя Anthropic Джареда Каплана, это «самый серьезный прогресс в сфере безопасности ИИ за последние полтора года».

Сравнение ИИ-моделей по ключевым метрикам. Источник: Anthropic.

Одновременно с релизом Anthropic представила Claude Agent SDK — инфраструктуру, на которой работает Claude Code, доступную теперь сторонним разработчикам для создания собственных ИИ-агентов. Кроме того, подписчики уровня Max получили доступ к экспериментальному режиму Imagine with Claude, позволяющему в реальном времени генерировать программное обеспечение «с нуля».

Запуск Sonnet 4.5 демонстрирует высокую скорость обновлений в индустрии: модель вышла менее чем через два месяца после релиза Claude Opus 4.1 и всего через четыре месяца после Claude Sonnet 4. Компания уже намекнула, что до конца года могут состояться еще один-два релиза.

9 из 10 программистов уже пишут код с ИИ но не доверяют ему
9 из 10 программистов уже пишут код с ИИ, но не доверяют ему
По теме
9 из 10 программистов уже пишут код с ИИ, но не доверяют ему
ИИ-редактор кода Cursor запустил бесплатный курс для разработчиков
ИИ-редактор кода Cursor запустил бесплатный курс для разработчиков
По теме
ИИ-редактор кода Cursor запустил бесплатный курс для разработчиков
Meta представила ИИ который не только пишет но и «понимает» код
Meta представила ИИ, который не только пишет, но и «понимает» код
По теме
Meta представила ИИ, который не только пишет, но и «понимает» код
Читайте также
Сооснователь LinkedIn назвал «слепую зону» для инвесторов
Сооснователь LinkedIn назвал «слепую зону» для инвесторов
Сооснователь LinkedIn назвал «слепую зону» для инвесторов
Пользователи ChatGPT жалуются на случаи «ИИ-психоза»
Пользователи ChatGPT жалуются на случаи «ИИ-психоза»
Пользователи ChatGPT жалуются на случаи «ИИ-психоза»
Автоматизация ускоряется: ИИ заменяет офисных сотрудников быстрее, чем ожидалось
Автоматизация ускоряется: ИИ заменяет офисных сотрудников быстрее, чем ожидалось
Автоматизация ускоряется: ИИ заменяет офисных сотрудников быстрее, чем ожидалось
1 комментарий
Meta уволит 600 сотрудников ИИ-подразделения
Meta уволит 600 сотрудников ИИ-подразделения
Meta уволит 600 сотрудников ИИ-подразделения
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

0

Помучил Клода 4 конвертацией Gradle скриптов из Groovy на Kotlin. Так само полностью рабочий код и не выдало или устаревшие функции выдает, или (как всегда) генерирует использование несуществующих классов. Даже от китайского DeepSeek больше пользы.

Zhan Chubukou
Zhan Chubukou Шчолкаю зубамі в ЗАО "Прыдацелі і атшчыпенцы"
0

DeepSeek вообще печально работает. У китайцев неплохо получаются модели для zero-shot: Qwen 3 и Kimi с такими вполне неплохо справляются. Но когда контекст разрастается до 4-5 вопросов - начинают галлюцинировать. Пробовал сегодня этот Sonnet 4.5 - по сравнению с другим сонетами, конечно, лучше, но до Opus 4.0 thinking - не дотягивает. По крайней мере в моём скоупе задач.

0

Просто нужно иметь больше желания получить результат, чем завалить. Можно, например, сделать гайд по миграции конфигов с груви на котлин и дать его модели вместе с задачей. Можно дать примеры уже смигированных конфигов. Можно мигрировать частями. Можно дать какие-нибудь инструменты поиска документации, а не надеяться, что оно знает Gradle Kotlin DLS нужной версии. Ну, и может быть так, что конкретно эта задача по какой-то причине не годится для ИИ.