Anthropic показала новую ИИ-модель, которая обгоняет GPT-4 и Gemini
Стартап выходцев из OpenAI представил новую модель Claude 3, которая значительно улучшилась по сравнению с предшественниками и текущими аналогами от других разработчиков.
Семейство Claude 3 состоит из трех моделей: Haiku, Sonnet и Opus. Каждая из последующих производительнее предыдущей. Контекстное окно у всех составляет 200 тысяч токенов, по индивидуальному запросу его могут расширить до 1 миллиона токенов. Протестировать Opus и Sonnet можно на сайте claude.ai или через API, доступ к Haiku откроют позднее. Две модели открыты пользователям 159 стран, России и Беларуси в их числе нет.
Особенность нового семейства — мультимодальность, то есть способность понимать и обрабатывать как текстовые, так и визуальные данные. Это делает Claude 3 не только более гибкой в применении, но и дает новые возможности использования в разных сферах, от образования до медицины.
- Модель Opus — самая продвинутая модель из трех представленных. Компания отмечает, что при прохождении тестов, оценивающих математические навыки, умение работать с кодом, рассуждать и отвечать на вопросы, она обошла GPT-4.
- Sonnet вдвое быстрее Claude 2 и Claude 2.1. Разработчики отметили, что эта модель хорошо справляется с запросами, которые требуют быстрых ответов, например, на поиск информации или автоматизацию продаж.
- Haiku справляется с обработкой научных исследований на 10 тысяч токенов с графиками и диаграммами менее чем за 3 секунды. Стартап планирует еще сильнее ускорить этот процесс.
Все модели могут обрабатывать фотографии, графики, диаграммы; лучше понимают «сложные, многоэтапные указания», стиль повествования и соблюдают параметры ответов, заданные пользователем. Версии Claude 3 стали меньше ошибаться. Возникает меньше случаев, когда модели ошибочно считают тему запроса запретной и отказываются отвечать, ссылаясь на неполное понимание контекста.
Разработчики провели обучение моделей, используя смешанный набор данных. Он включал не только публичные доступные источники, но и внутренние данные. Это позволило добиться высокого качества обработки информации. Обучение проводилось на мощностях облачных сервисов Amazon AWS и Google Cloud. Обе компании инвестировали значительные средства в Anthropic.
Anthropic считает, что Hieku может помочь техподдержке давать быстрые ответы клиентам, модераторам оперативнее обрабатывать жалобы и выявлять сомнительное поведение пользователей. Sonnet можно использовать для обработки библиотеки знаний, прогнозов, генерации кода, распознаванию текста и контролю качества. Opus подойдет для интерактивного программирования, генерации гипотез, анализа рыночных трендов и прогнозов, а также разработки лекарств.
Читать на dev.by