devby 17 лет! Вспоминаем переходный возраст и делимся виш-листом
Support us

Anthropic выпустила «гибридную» модель Claude 3.7 Sonnet с выбором режима «мышления»

Стартап представил свою новую модель Claude 3.7 Sonnet, которую называет первой в отрасли «гибридной рассуждающей моделью». Особенность новинки — возможность для пользователей контролировать, как долго нейросеть будет «думать» над ответом, сочетая в себе скорость обычных моделей и глубину рассуждений.

Оставить комментарий
Anthropic выпустила «гибридную» модель Claude 3.7 Sonnet с выбором режима «мышления»

Стартап представил свою новую модель Claude 3.7 Sonnet, которую называет первой в отрасли «гибридной рассуждающей моделью». Особенность новинки — возможность для пользователей контролировать, как долго нейросеть будет «думать» над ответом, сочетая в себе скорость обычных моделей и глубину рассуждений.

Claude 3.7 Sonnet доступна как в приложениях Claude, так и в веб-версии чат-бота, включая бесплатный доступ. Разработчики также могут использовать новую нейросеть через API Anthropic, Amazon Bedrock и Google Cloud’s Vertix AI, при этом стоимость осталась на уровне предшественницы, 3.5 Sonnet: $3 за 1 миллион входных токенов и $15 за 1 миллион выходных токенов.

Источник: Anthropic.

Отличие Claude 3.7 Sonnet от конкурентов заключается в её «гибридности». Вместо того, чтобы предлагать отдельные модели для быстрого ответа и для более глубокого анализа, Anthropic объединила обе возможности в одной системе. Пользователь может выбрать, когда модели следует отвечать сразу, а когда — потратить больше времени на обдумывание. Anthropic заявил, что стремится к тому, чтобы в будущем Claude самостоятельно определяла, сколько времени необходимо для обдумывания ответа на вопрос.

В стандартном режиме Claude 3.7 Sonnet — это улучшенная версия 3.5 Sonnet с обновленной базой данных (информация до ноября 2024 года). В режиме расширенного мышления ИИ самостоятельно размышляет перед ответом, что повышает производительность при решении задач по математике, физике, кодингу и других сложных задач.

Источник: Anthropic.

Как отмечает вице-президент Anthropic по продуктам Майкл Герстенхабер, иногда важно, чтобы ответ на вопрос занимал не более 200 миллисекунд. Для большей прозрачности Claude 3.7 Sonnet показывает свой «внутренний план» решения задачи через «черновик». Пользователи могут видеть ход мыслей модели, что помогает понять, как она пришла к ответу и где произошла ошибка, если она есть. При этом некоторые части процесса могут быть скрыты в целях безопасности.

В тестах Claude 3.7 Sonnet показала более высокую точность в задачах кодирования по сравнению с OpenAI o3-mini и в задачах взаимодействия с пользователями и API в розничной торговле по сравнению с OpenAI o1. Также отмечается, что Claude 3.7 Sonnet реже отказывается отвечать на вопросы, так как лучше различает вредоносные и безобидные запросы.

Источник: Anthropic.

Руководитель отдела исследований продуктов Anthropic Дайанн Пенн также рассказала, что компания протестировала свои модели даже на видеоигре Pokémon, имитируя нажатие кнопок контроллера через API. Claude 3.5 Sonnet не смог выбраться из Pallet Town в начале игры, в то время как версия 3.7 смогла победить нескольких боссов.

Вместе с Claude 3.7 Sonnet Anthropic представила Claude Code — инструмент для программирования, который позиционирует как «активного сотрудника, способного искать и читать код, редактировать файлы, писать и выполнять тесты, фиксировать и отправлять код на GitHub, а также использовать инструменты командной строки». Claude Code позволяет разработчикам анализировать и модифицировать кодовую базу, описывая свои действия и тестируя проект на наличие ошибок.

Чат-бот Grok заговорил — и начал материться флиртовать с пользователями и унижать ChatGPT
Чат-бот Grok заговорил — и начал материться, флиртовать с пользователями и унижать ChatGPT
По теме
Чат-бот Grok заговорил — и начал материться, флиртовать с пользователями и унижать ChatGPT
DeepSeek: громкий прорыв или большая афера?
DeepSeek: громкий прорыв или большая афера?
По теме
DeepSeek: громкий прорыв или большая афера?
Все чат-боты добавляют функцию Deep Research. Что это такое?
Все чат-боты добавляют функцию Deep Research. Что это такое?
По теме
Все чат-боты добавляют функцию Deep Research. Что это такое?
Читайте также
10 тысяч компаний за пятилетку: ОАЭ хотят превратить в ИИ-сверхдержаву
10 тысяч компаний за пятилетку: ОАЭ хотят превратить в ИИ-сверхдержаву
10 тысяч компаний за пятилетку: ОАЭ хотят превратить в ИИ-сверхдержаву
1 комментарий
Генеративные портреты помогают кандидатам при найме
Генеративные портреты помогают кандидатам при найме
Генеративные портреты помогают кандидатам при найме
5 комментариев
Как говорить про ИИ на собесе, чтобы вас взяли на работу
Как говорить про ИИ на собесе, чтобы вас взяли на работу
Как говорить про ИИ на собесе, чтобы вас взяли на работу
ИИ стал удобным оправданием для массовых увольнений
ИИ стал удобным оправданием для массовых увольнений
ИИ стал удобным оправданием для массовых увольнений

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.