Support us

Anthropic выпустила Claude Sonnet 5 — почти как Opus 4.8, но дешевле

Компания представила Claude Sonnet 5 — новую среднюю модель, которая, по заявлению компании, приблизилась по возможностям к флагманской Opus 4.8, но стоит заметно дешевле. 

Оставить комментарий
Anthropic выпустила Claude Sonnet 5 — почти как Opus 4.8, но дешевле

Компания представила Claude Sonnet 5 — новую среднюю модель, которая, по заявлению компании, приблизилась по возможностям к флагманской Opus 4.8, но стоит заметно дешевле. 

Модель стала доступна во всех тарифах Claude и по умолчанию включена для пользователей Free и Pro. В API, Claude Code и Claude Platform до 31 августа она будет стоить $2 за миллион входных токенов и $10 за миллион выходных. Затем цена вырастет до $3 и $15 соответственно. Для сравнения, Opus 4.8 стоит $5 за миллион входных токенов и $25 за миллион выходных.

Anthropic называет Sonnet 5 своей самой агентной моделью линейки Sonnet. По данным компании, она заметно лучше предшественницы Sonnet 4.6 справляется с рассуждениями, программированием, работой с инструментами и задачами из сферы интеллектуального труда.

Источник: Anthropic.

На SWE-bench Pro, бенчмарке для агентного программирования, Sonnet 5 получила 63,2% против 58,1% у Sonnet 4.6 и 69,2% у Opus 4.8. В тесте Terminal-Bench 2.1 ее результат составил 80,4% — почти на уровне Opus 4.8 с 82,7%. На бенчмарке GDPval-AA v2 для задач интеллектуального труда Sonnet 5 даже немного опередила флагманскую модель: 1618 баллов против 1615.

Разработчик утверждают, что новая модель лучше доводит сложные задания до конца. Один из тестировщиков из Zapier рассказал, что Sonnet 5 смогла самостоятельно обновить статусы аккаунтов в Salesforce и разослать анонс клиентам — задача, на которой предыдущие версии модели останавливались на середине.

Компания также заявила, что Sonnet 5 реже галлюцинирует и льстит пользователю, лучше отклоняет вредоносные запросы и устойчивее к промпт-инъекциям. При этом по способности выполнять потенциально опасные киберзадачи она заметно уступает Opus 4.8 и Mythos 5: в тесте на создание эксплойтов для Firefox модель не смогла создать ни одного работающего эксплойта. Для нее по умолчанию включили киберзащиту, которая блокирует опасные сценарии использования.

Anthropic жалуется что Alibaba ворует данные Claude для обучения своего ИИ
Anthropic жалуется, что Alibaba ворует данные Claude для обучения своего ИИ 
По теме
Anthropic жалуется, что Alibaba ворует данные Claude для обучения своего ИИ
Чистый GitHub-репозиторий может заставить Claude Code установить вредоносное ПО
Чистый GitHub-репозиторий может заставить Claude Code установить вредоносное ПО 
По теме
Чистый GitHub-репозиторий может заставить Claude Code установить вредоносное ПО
Claude завоёвывает платных пользователей и догоняет ChatGPT
Claude завоёвывает платных пользователей и догоняет ChatGPT
По теме
Claude завоёвывает платных пользователей и догоняет ChatGPT
Читайте также
«Лучший в мире ИИ для кодинга» от Anthropic работает автономно до 30 часов
«Лучший в мире ИИ для кодинга» от Anthropic работает автономно до 30 часов
«Лучший в мире ИИ для кодинга» от Anthropic работает автономно до 30 часов
3 комментария
Anthropic представила свою самую быструю и экономичную модель для кодинга
Anthropic представила свою самую быструю и экономичную модель для кодинга
Anthropic представила свою самую быструю и экономичную модель для кодинга
Anthropic выпустила «лучшую модель для кодинга в мире»
Anthropic выпустила «лучшую модель для кодинга в мире»
Anthropic выпустила «лучшую модель для кодинга в мире»
Anthropic выпустила Claude Opus 4.8: ИИ чаще признаёт ошибки и лучше работает с кодом
Anthropic выпустила Claude Opus 4.8: ИИ чаще признаёт ошибки и лучше работает с кодом
Anthropic выпустила Claude Opus 4.8: ИИ чаще признаёт ошибки и лучше работает с кодом

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.