Anthropic выпустила «лучшую модель для кодинга в мире»

Anthropic представила агентную модель Claude Opus 4.5, которую называет «лучшей в мире» для написания кода, выполнения офисных задач и взаимодействия с компьютером.

Оставить комментарий

Разработчики утверждают, что в некоторых категориях программирования она превзошла Gemini 3, после релиза которой рыночная капитализация Google обновила исторический рекорд. Opus 4.5 лучше своих предшественниц проводит глубокие исследования, работает с презентациями и таблицами. Она показала отличные результаты на бенчмарках для кодинга (SWE-Bench, Terminal-bench), на использование инструментов (tau2-bench, MCP Atlas), а также на общих ARC-AGI 2 и GPQA Diamond.

Также расширение Claude for Chrome стало доступно обладателям подписки Max, которые работают в браузере Google, а для всех платных подписчиков появилась функция безграничного чата — бот больше не будет выдавать ошибки из-за переполнения контекстного окна и сможет лучше обеспечить согласованность файлов и чатов. Также в Opus 4.5 стала лучше в агентских сценариях и самостоятельном совершенствовании своих процессов. Кроме того, разработчики называют Opus 4.5 своей самой безопасной моделью. Она противостоит внедрению вредоносных промптов даже лучше Gemini 3 Pro.

Опробовать Opus 4.5 можно в приложениях Anthropic, через API-интерфейс компании и на трёх крупнейших облачных платформах. Для разработчиков тариф — $5 и $25 за миллион токенов на ввод и вывод.

Anthropic запустила Claude Skills — систему папок-«навыков» для рабочих задач
По теме
Anthropic запустила Claude Skills — систему папок-«навыков» для рабочих задач
В корпоративном ИИ Copilot вырывается вперёд, а Claude не оправдал ожиданий
По теме
В корпоративном ИИ Copilot вырывается вперёд, а Claude не оправдал ожиданий

Читать на dev.by