Как сформировать полезные привычки и бустануть карьеру? Бесплатный марафон
Support us

Anthropic выпустила «гибридную» модель Claude 3.7 Sonnet с выбором режима «мышления»

Стартап представил свою новую модель Claude 3.7 Sonnet, которую называет первой в отрасли «гибридной рассуждающей моделью». Особенность новинки — возможность для пользователей контролировать, как долго нейросеть будет «думать» над ответом, сочетая в себе скорость обычных моделей и глубину рассуждений.

Оставить комментарий
Anthropic выпустила «гибридную» модель Claude 3.7 Sonnet с выбором режима «мышления»

Стартап представил свою новую модель Claude 3.7 Sonnet, которую называет первой в отрасли «гибридной рассуждающей моделью». Особенность новинки — возможность для пользователей контролировать, как долго нейросеть будет «думать» над ответом, сочетая в себе скорость обычных моделей и глубину рассуждений.

Claude 3.7 Sonnet доступна как в приложениях Claude, так и в веб-версии чат-бота, включая бесплатный доступ. Разработчики также могут использовать новую нейросеть через API Anthropic, Amazon Bedrock и Google Cloud’s Vertix AI, при этом стоимость осталась на уровне предшественницы, 3.5 Sonnet: $3 за 1 миллион входных токенов и $15 за 1 миллион выходных токенов.

Источник: Anthropic.

Отличие Claude 3.7 Sonnet от конкурентов заключается в её «гибридности». Вместо того, чтобы предлагать отдельные модели для быстрого ответа и для более глубокого анализа, Anthropic объединила обе возможности в одной системе. Пользователь может выбрать, когда модели следует отвечать сразу, а когда — потратить больше времени на обдумывание. Anthropic заявил, что стремится к тому, чтобы в будущем Claude самостоятельно определяла, сколько времени необходимо для обдумывания ответа на вопрос.

В стандартном режиме Claude 3.7 Sonnet — это улучшенная версия 3.5 Sonnet с обновленной базой данных (информация до ноября 2024 года). В режиме расширенного мышления ИИ самостоятельно размышляет перед ответом, что повышает производительность при решении задач по математике, физике, кодингу и других сложных задач.

Источник: Anthropic.

Как отмечает вице-президент Anthropic по продуктам Майкл Герстенхабер, иногда важно, чтобы ответ на вопрос занимал не более 200 миллисекунд. Для большей прозрачности Claude 3.7 Sonnet показывает свой «внутренний план» решения задачи через «черновик». Пользователи могут видеть ход мыслей модели, что помогает понять, как она пришла к ответу и где произошла ошибка, если она есть. При этом некоторые части процесса могут быть скрыты в целях безопасности.

В тестах Claude 3.7 Sonnet показала более высокую точность в задачах кодирования по сравнению с OpenAI o3-mini и в задачах взаимодействия с пользователями и API в розничной торговле по сравнению с OpenAI o1. Также отмечается, что Claude 3.7 Sonnet реже отказывается отвечать на вопросы, так как лучше различает вредоносные и безобидные запросы.

Источник: Anthropic.

Руководитель отдела исследований продуктов Anthropic Дайанн Пенн также рассказала, что компания протестировала свои модели даже на видеоигре Pokémon, имитируя нажатие кнопок контроллера через API. Claude 3.5 Sonnet не смог выбраться из Pallet Town в начале игры, в то время как версия 3.7 смогла победить нескольких боссов.

Вместе с Claude 3.7 Sonnet Anthropic представила Claude Code — инструмент для программирования, который позиционирует как «активного сотрудника, способного искать и читать код, редактировать файлы, писать и выполнять тесты, фиксировать и отправлять код на GitHub, а также использовать инструменты командной строки». Claude Code позволяет разработчикам анализировать и модифицировать кодовую базу, описывая свои действия и тестируя проект на наличие ошибок.

Чат-бот Grok заговорил — и начал материться флиртовать с пользователями и унижать ChatGPT
Чат-бот Grok заговорил — и начал материться, флиртовать с пользователями и унижать ChatGPT
По теме
Чат-бот Grok заговорил — и начал материться, флиртовать с пользователями и унижать ChatGPT
DeepSeek: громкий прорыв или большая афера?
DeepSeek: громкий прорыв или большая афера?
По теме
DeepSeek: громкий прорыв или большая афера?
Все чат-боты добавляют функцию Deep Research. Что это такое?
Все чат-боты добавляют функцию Deep Research. Что это такое?
По теме
Все чат-боты добавляют функцию Deep Research. Что это такое?
Большой ресёрч-2024: расскажите, как работали и жили весь год.

Заполнить анонимно

Читайте также
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Искусственный интеллект уже стал повседневностью: голосовой помощник включает музыку, робот-пылесос сканирует пространство и убирает квартиру, алгоритм ранжирования настраивает ленту в TikTok, а беспилотные такси уже свободно курсируют по городам. Получить профессию в сфере ИИ с зарплатой от $100k в год тоже стало проще — собрали 5 интересных курсов от Udacity. 
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
4 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.