Николай Чикишев world 1 июля 2026, 10:10

Anthropic выпустила Claude Sonnet 5 — почти как Opus 4.8, но дешевле

Компания представила Claude Sonnet 5 — новую среднюю модель, которая, по заявлению компании, приблизилась по возможностям к флагманской Opus 4.8, но стоит заметно дешевле.

Оставить комментарий

Anthropic выпустила Claude Sonnet 5 — почти как Opus 4.8, но дешевле

Компания представила Claude Sonnet 5 — новую среднюю модель, которая, по заявлению компании, приблизилась по возможностям к флагманской Opus 4.8, но стоит заметно дешевле.

Модель стала доступна во всех тарифах Claude и по умолчанию включена для пользователей Free и Pro. В API, Claude Code и Claude Platform до 31 августа она будет стоить $2 за миллион входных токенов и $10 за миллион выходных. Затем цена вырастет до $3 и $15 соответственно. Для сравнения, Opus 4.8 стоит $5 за миллион входных токенов и $25 за миллион выходных.

Anthropic называет Sonnet 5 своей самой агентной моделью линейки Sonnet. По данным компании, она заметно лучше предшественницы Sonnet 4.6 справляется с рассуждениями, программированием, работой с инструментами и задачами из сферы интеллектуального труда.

На SWE-bench Pro, бенчмарке для агентного программирования, Sonnet 5 получила 63,2% против 58,1% у Sonnet 4.6 и 69,2% у Opus 4.8. В тесте Terminal-Bench 2.1 ее результат составил 80,4% — почти на уровне Opus 4.8 с 82,7%. На бенчмарке GDPval-AA v2 для задач интеллектуального труда Sonnet 5 даже немного опередила флагманскую модель: 1618 баллов против 1615.

Разработчик утверждают, что новая модель лучше доводит сложные задания до конца. Один из тестировщиков из Zapier рассказал, что Sonnet 5 смогла самостоятельно обновить статусы аккаунтов в Salesforce и разослать анонс клиентам — задача, на которой предыдущие версии модели останавливались на середине.

Компания также заявила, что Sonnet 5 реже галлюцинирует и льстит пользователю, лучше отклоняет вредоносные запросы и устойчивее к промпт-инъекциям. При этом по способности выполнять потенциально опасные киберзадачи она заметно уступает Opus 4.8 и Mythos 5: в тесте на создание эксплойтов для Firefox модель не смогла создать ни одного работающего эксплойта. Для нее по умолчанию включили киберзащиту, которая блокирует опасные сценарии использования.