Anthropic выпустила кодинг-модель, но специально урезала её возможности
Компания представила модель Claude Opus 4.7. В новой версии усилили возможности разработки и визуального анализа, но при этом сознательно ограничили часть функций по сравнению с более мощной Claude Mythos.
Компания представила модель Claude Opus 4.7. В новой версии усилили возможности разработки и визуального анализа, но при этом сознательно ограничили часть функций по сравнению с более мощной Claude Mythos.
По данным компании, Opus 4.7 стала заметно лучше в продвинутом программировании, особенно при работе со сложными и длительными задачами. Модель точнее следует инструкциям, способна самостоятельно проверять результаты и требует меньше контроля со стороны пользователя. В Anthropic отмечают, что теперь ей можно «уверенно поручать задачи, которые раньше требовали постоянного надзора».
Серьезно улучшились и мультимодальные способности. Модель лучше работает с изображениями высокого и низкого разрешения (до 2576 пикселей), точнее извлекает данные из сложных диаграмм и интерфейсов, а также генерирует более качественные UI-макеты, презентации и документы.
Сравнение Opus 4.7 с Opus 4.6, GPT-5.4, Gemini 3.1 Pro и Mythos: новая модель улучшает показатели, но уступает Mythos в ключевых задачах. Источник: Anthropic.
В тестах Opus 4.7 показала рост примерно на 10% в задачах агентного программирования и на 13% в работе с визуальными входными данными по сравнению с версией 4.6. В других бенчмарках улучшения более умеренные, однако модель демонстрирует более стабильное поведение на длинных задачах и лучше справляется с контекстом.
Отдельный акцент сделан на памяти: Opus 4.7 эффективнее использует файловую память и может сохранять важные данные между сессиями, что упрощает работу с долгосрочными проектами и снижает необходимость повторно задавать контекст.
Claude Opus 4.7 демонстрирует рост точности в задачах кодинга по сравнению с версией 4.6, включая мультиязычные и мультимодальные сценарии. Источник: Anthropic.
При этом Anthropic указывает, что Opus 4.7 не является фронтирной моделью компании. Ее возможности в области кибербезопасности и сложного программирования намеренно снижены по сравнению с Claude Mythos. В процессе обучения разработчики специально экспериментировали с ограничением этих навыков.
Вместо этого в Opus 4.7 внедрены новые защитные механизмы: модель автоматически распознает и блокирует запросы, связанные с потенциально опасными сценариями, например, взломом или вредоносным использованием кода.
Производительность Opus 4.7 растtт с увеличением вычислительных ресурсов и стабильно опережает Opus 4.6 на всех уровнях нагрузки. Источник: Anthropic.
Claude Mythos, представленная ранее, остается закрытой и доступна только ограниченному кругу партнеров, работающих с критически важным ПО — среди них крупные технологические компании и инфраструктурные игроки.
С точки зрения безопасности Opus 4.7 демонстрирует сопоставимый профиль с версией 4.6: низкий уровень нежелательного поведения, включая склонность к обману или выполнению вредоносных запросов. В отдельных аспектах, таких как устойчивость к промпт-инъекциям и честность, модель даже улучшилась, хотя в некоторых случаях остается менее стабильной.
Claude Opus 4.7 уже доступна во всех продуктах Anthropic, включая API, а также через облачные платформы Amazon Bedrock, Google Vertex AI и Microsoft Foundry. Стоимость осталась на уровне предыдущей версии: $5 за миллион входных токенов и $25 за миллион выходных.
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.