Anthropic выпустила Claude Sonnet 5 — почти как Opus 4.8, но дешевле
Компания представила Claude Sonnet 5 — новую среднюю модель, которая, по заявлению компании, приблизилась по возможностям к флагманской Opus 4.8, но стоит заметно дешевле.
Компания представила Claude Sonnet 5 — новую среднюю модель, которая, по заявлению компании, приблизилась по возможностям к флагманской Opus 4.8, но стоит заметно дешевле.
Компания представила Claude Sonnet 5 — новую среднюю модель, которая, по заявлению компании, приблизилась по возможностям к флагманской Opus 4.8, но стоит заметно дешевле.
Модель стала доступна во всех тарифах Claude и по умолчанию включена для пользователей Free и Pro. В API, Claude Code и Claude Platform до 31 августа она будет стоить $2 за миллион входных токенов и $10 за миллион выходных. Затем цена вырастет до $3 и $15 соответственно. Для сравнения, Opus 4.8 стоит $5 за миллион входных токенов и $25 за миллион выходных.
Anthropic называет Sonnet 5 своей самой агентной моделью линейки Sonnet. По данным компании, она заметно лучше предшественницы Sonnet 4.6 справляется с рассуждениями, программированием, работой с инструментами и задачами из сферы интеллектуального труда.

На SWE-bench Pro, бенчмарке для агентного программирования, Sonnet 5 получила 63,2% против 58,1% у Sonnet 4.6 и 69,2% у Opus 4.8. В тесте Terminal-Bench 2.1 ее результат составил 80,4% — почти на уровне Opus 4.8 с 82,7%. На бенчмарке GDPval-AA v2 для задач интеллектуального труда Sonnet 5 даже немного опередила флагманскую модель: 1618 баллов против 1615.
Разработчик утверждают, что новая модель лучше доводит сложные задания до конца. Один из тестировщиков из Zapier рассказал, что Sonnet 5 смогла самостоятельно обновить статусы аккаунтов в Salesforce и разослать анонс клиентам — задача, на которой предыдущие версии модели останавливались на середине.
Компания также заявила, что Sonnet 5 реже галлюцинирует и льстит пользователю, лучше отклоняет вредоносные запросы и устойчивее к промпт-инъекциям. При этом по способности выполнять потенциально опасные киберзадачи она заметно уступает Opus 4.8 и Mythos 5: в тесте на создание эксплойтов для Firefox модель не смогла создать ни одного работающего эксплойта. Для нее по умолчанию включили киберзащиту, которая блокирует опасные сценарии использования.



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.