Anthropic выпустила Claude Opus 4.8: ИИ чаще признаёт ошибки и лучше работает с кодом
Компания представила Claude Opus 4.8 — новую версию своей самой мощной публичной модели. Обновление вышло всего через 41 день после Opus 4.7, что заметно быстрее обычного цикла релизов.
Компания представила Claude Opus 4.8 — новую версию своей самой мощной публичной модели. Обновление вышло всего через 41 день после Opus 4.7, что заметно быстрее обычного цикла релизов.
Anthropic отмечает, что делает акцент не только на росте показателей в бенчмарках, но и на более осторожном поведении модели. По словам разработчиков, Opus 4.8 лучше распознает неопределенность, чаще указывает на проблемы во входных данных и реже делает неподтвержденные выводы.
«Одно из самых заметных улучшений Opus 4.8 — ее честность», — сказано на сайте компании. По данным разработчиков, новая модель примерно в четыре раза реже, чем предыдущая, оставляет без комментария ошибки в написанном ею коде.
Похожую особенность отметили и ранние тестировщики. В Bridgewater Associates заявили, что главным отличием Opus 4.8 стала способность модели «заранее указывать на проблемы во входных и выходных данных анализа» — то, что другие модели часто пропускали и оставляли пользователям для самостоятельной проверки.
Вместе с новой моделью Anthropic представила функцию Dynamic Workflows для Claude Code. Она позволяет модели планировать сложную задачу, запускать сотни параллельных субагентов в одной сессии и затем проверять результаты перед ответом пользователю. Функция доступна в исследовательском режиме для пользователей Claude Code на планах Enterprise, Team и Max.
Anthropic приводит пример масштабной миграции кодовой базы: Claude Code с Opus 4.8 может проводить изменения в проектах на сотни тысяч строк кода — от постановки задачи до объединения изменений, используя существующие тесты как критерий проверки.
Компания также добавила настройку effort control в Claude.ai и Cowork. Теперь пользователи могут выбирать, сколько усилий модель должна потратить на ответ. На высоких настройках Claude будет «думать» чаще и глубже, но расходовать больше лимитов. На низких — отвечать быстрее и экономнее.
Еще одно изменение касается разработчиков: Messages API теперь позволяет добавлять системные инструкции внутри массива сообщений. Это дает возможность менять указания для Claude прямо во время выполнения задачи — например, обновлять права доступа, лимиты токенов или контекст окружения, не ломая кеш промпта.
Стандартная цена Opus 4.8 осталась прежней: $5 за миллион входных токенов и $25 за миллион выходных токенов. При этом fast mode, в котором модель работает примерно в 2,5 раза быстрее, стал в три раза дешевле, чем у предыдущих моделей.
Anthropic также сообщила, что продолжает работать над более мощным классом моделей Mythos. Сейчас Claude Mythos Preview используют ограниченные организации в рамках Project Glasswing для задач кибербезопасности. Компания пока не выпускает эти модели широко из-за необходимости дополнительных защитных механизмов, но ожидает, что сможет открыть доступ к моделям уровня Mythos «в ближайшие недели».
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.