Anthropic выпустила «гибридную» модель Claude 3.7 Sonnet с выбором режима «мышления»

Стартап представил свою новую модель Claude 3.7 Sonnet, которую называет первой в отрасли «гибридной рассуждающей моделью». Особенность новинки — возможность для пользователей контролировать, как долго нейросеть будет «думать» над ответом, сочетая в себе скорость обычных моделей и глубину рассуждений.

Оставить комментарий

Claude 3.7 Sonnet доступна как в приложениях Claude, так и в веб-версии чат-бота, включая бесплатный доступ. Разработчики также могут использовать новую нейросеть через API Anthropic, Amazon Bedrock и Google Cloud’s Vertix AI, при этом стоимость осталась на уровне предшественницы, 3.5 Sonnet: $3 за 1 миллион входных токенов и $15 за 1 миллион выходных токенов.

Источник: Anthropic.

Отличие Claude 3.7 Sonnet от конкурентов заключается в её «гибридности». Вместо того, чтобы предлагать отдельные модели для быстрого ответа и для более глубокого анализа, Anthropic объединила обе возможности в одной системе. Пользователь может выбрать, когда модели следует отвечать сразу, а когда — потратить больше времени на обдумывание. Anthropic заявил, что стремится к тому, чтобы в будущем Claude самостоятельно определяла, сколько времени необходимо для обдумывания ответа на вопрос.

В стандартном режиме Claude 3.7 Sonnet — это улучшенная версия 3.5 Sonnet с обновленной базой данных (информация до ноября 2024 года). В режиме расширенного мышления ИИ самостоятельно размышляет перед ответом, что повышает производительность при решении задач по математике, физике, кодингу и других сложных задач.

Источник: Anthropic.

Как отмечает вице-президент Anthropic по продуктам Майкл Герстенхабер, иногда важно, чтобы ответ на вопрос занимал не более 200 миллисекунд. Для большей прозрачности Claude 3.7 Sonnet показывает свой «внутренний план» решения задачи через «черновик». Пользователи могут видеть ход мыслей модели, что помогает понять, как она пришла к ответу и где произошла ошибка, если она есть. При этом некоторые части процесса могут быть скрыты в целях безопасности.

В тестах Claude 3.7 Sonnet показала более высокую точность в задачах кодирования по сравнению с OpenAI o3-mini и в задачах взаимодействия с пользователями и API в розничной торговле по сравнению с OpenAI o1. Также отмечается, что Claude 3.7 Sonnet реже отказывается отвечать на вопросы, так как лучше различает вредоносные и безобидные запросы.

Источник: Anthropic.

Руководитель отдела исследований продуктов Anthropic Дайанн Пенн также рассказала, что компания протестировала свои модели даже на видеоигре Pokémon, имитируя нажатие кнопок контроллера через API. Claude 3.5 Sonnet не смог выбраться из Pallet Town в начале игры, в то время как версия 3.7 смогла победить нескольких боссов.

Вместе с Claude 3.7 Sonnet Anthropic представила Claude Code — инструмент для программирования, который позиционирует как «активного сотрудника, способного искать и читать код, редактировать файлы, писать и выполнять тесты, фиксировать и отправлять код на GitHub, а также использовать инструменты командной строки». Claude Code позволяет разработчикам анализировать и модифицировать кодовую базу, описывая свои действия и тестируя проект на наличие ошибок.

Чат-бот Grok заговорил — и начал материться, флиртовать с пользователями и унижать ChatGPT
По теме
Чат-бот Grok заговорил — и начал материться, флиртовать с пользователями и унижать ChatGPT
DeepSeek: громкий прорыв или большая афера?
По теме
DeepSeek: громкий прорыв или большая афера?
Все чат-боты добавляют функцию Deep Research. Что это такое?
По теме
Все чат-боты добавляют функцию Deep Research. Что это такое?

Читать на dev.by