Николай Чикишев 5 марта 2024, 13:45

Anthropic показала новую ИИ-модель, которая обгоняет GPT-4 и Gemini

Стартап выходцев из OpenAI представил новую модель Claude 3, которая значительно улучшилась по сравнению с предшественниками и текущими аналогами от других разработчиков.

1 комментарий

Семейство Claude 3 состоит из трех моделей: Haiku, Sonnet и Opus. Каждая из последующих производительнее предыдущей. Контекстное окно у всех составляет 200 тысяч токенов, по индивидуальному запросу его могут расширить до 1 миллиона токенов. Протестировать Opus и Sonnet можно на сайте claude.ai или через API, доступ к Haiku откроют позднее. Две модели открыты пользователям 159 стран, России и Беларуси в их числе нет.

Особенность нового семейства — мультимодальность, то есть способность понимать и обрабатывать как текстовые, так и визуальные данные. Это делает Claude 3 не только более гибкой в применении, но и дает новые возможности использования в разных сферах, от образования до медицины.

Модель Opus — самая продвинутая модель из трех представленных. Компания отмечает, что при прохождении тестов, оценивающих математические навыки, умение работать с кодом, рассуждать и отвечать на вопросы, она обошла GPT-4.
Sonnet вдвое быстрее Claude 2 и Claude 2.1. Разработчики отметили, что эта модель хорошо справляется с запросами, которые требуют быстрых ответов, например, на поиск информации или автоматизацию продаж.
Haiku справляется с обработкой научных исследований на 10 тысяч токенов с графиками и диаграммами менее чем за 3 секунды. Стартап планирует еще сильнее ускорить этот процесс.

Сравнение моделей семейства Claude 3 с версиями GPT и Gemini. Источник: Anthropic.

Все модели могут обрабатывать фотографии, графики, диаграммы; лучше понимают «сложные, многоэтапные указания», стиль повествования и соблюдают параметры ответов, заданные пользователем. Версии Claude 3 стали меньше ошибаться. Возникает меньше случаев, когда модели ошибочно считают тему запроса запретной и отказываются отвечать, ссылаясь на неполное понимание контекста.

Процент некорректных отказов в разных моделях Claude. Источник: Anthropic.

Разработчики провели обучение моделей, используя смешанный набор данных. Он включал не только публичные доступные источники, но и внутренние данные. Это позволило добиться высокого качества обработки информации. Обучение проводилось на мощностях облачных сервисов Amazon AWS и Google Cloud. Обе компании инвестировали значительные средства в Anthropic.

Anthropic считает, что Hieku может помочь техподдержке давать быстрые ответы клиентам, модераторам оперативнее обрабатывать жалобы и выявлять сомнительное поведение пользователей. Sonnet можно использовать для обработки библиотеки знаний, прогнозов, генерации кода, распознаванию текста и контролю качества. Opus подойдет для интерактивного программирования, генерации гипотез, анализа рыночных трендов и прогнозов, а также разработки лекарств.

ИИ не угрожает большинству рабочих мест из-за дороговизны внедрения. Пока

По теме

ИИ не угрожает большинству рабочих мест из-за дороговизны внедрения. Пока

Тим Кук: у Apple есть планы на ИИ, но мы их пока не скажем

По теме

Тим Кук: у Apple есть планы на ИИ, но мы их пока не скажем

Microsoft рассказала о «принципах доступа к ИИ», которым следует

По теме

Microsoft рассказала о «принципах доступа к ИИ», которым следует

Читать на dev.by