🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

Claude 3 вытеснила GPT-4 с вершины рейтинга языковых моделей

Большая языковая модель Claude 3 Opus от Anthropic впервые превзошла GPT-4 от OpenAI на платформе Chatbot Arena, где ИИ-исследователи оценивают качество чат-ботов, пишет Ars Technica.

Оставить комментарий

Большая языковая модель Claude 3 Opus от Anthropic впервые превзошла GPT-4 от OpenAI на платформе Chatbot Arena, где ИИ-исследователи оценивают качество чат-ботов, пишет Ars Technica.

Пользователи Chatbot Arena вводят запрос и получают два результата от языковых моделей, названия которых скрыты. Нужно выбрать наиболее понравившийся результат. Площадка проводит тысячи сравнений и заполняет обновляемую рейтинговую таблицу. Сайтом управляет исследовательская организация Large Model Systems Organization (LMSYS ORG), которая занимается открытыми ИИ-моделями.

«Впервые лучшими среди доступных ИИ-моделей стали разработанные не OpenAI: Opus для сложных задач, Haiku — для случаев, когда нужно дёшево и быстро. Это обнадёживает: от конкуренции разработчиков все только выиграют. Но GPT-4 уже больше года, а конкуренты догнали её только сейчас», — прокомментировал событие независимый ИИ-исследователь Саймон Уиллисон.

Сейчас в рейтинге Chatbot Arena представлены четыре версии GPT-4, поскольку с каждым обновлением вывод модели менялся, и некоторые пользователи предпочитают конкретные версии или пользуются всеми для большей стабильности результатов. GPT-4 появилась в Chatbot Arena 10 мая 2023 года, через неделю после запуска рейтинга, и с тех пор различные её версии неизменно занимали верхние строчки. Исследователи ценят Chatbot Arena за возможность более или менее объективно сравнить эффективность чат-ботов. Ключевым фактором здесь является множество оценок, складывающихся в общую картину.

Успех Claude 3 уже подтолкнул некоторых пользователей перейти на неё с GPT-4. Также набирает популярность Gemini Advanced от Google. Позиции OpenAI пошатнулись, но компания готовит новые модели, например GPT-5.

OpenAI выпустит прокачанную GPT-5 в середине года
OpenAI выпустит прокачанную GPT-5 в середине года
По теме
OpenAI выпустит прокачанную GPT-5 в середине года
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Хороший код больше не важен? Почему разработка катится не туда — мнение техлида
Хороший код больше не важен? Почему разработка катится не туда — мнение техлида
Хороший код больше не важен? Почему разработка катится не туда — мнение техлида
Я посмотрел слитые исходники Claude Code — и увидел там не просто плохой код. Это симптом того, что ИТ-индустрия свернула не туда. Мы выбираем слушать самых громких, и не всегда самых компетентных людей.  Объясняю, почему логика «главное, чтобы работало и приносило деньги» опасна для разработки. И почему LLM не отменяют требований к качеству кода.
1 комментарий
Разработчики говорят, что следить за ИИ стало второй работой
Разработчики говорят, что следить за ИИ стало второй работой
Разработчики говорят, что следить за ИИ стало второй работой
Google: 90% разработчиков уже используют ИИ, но молчат об этом
Google: 90% разработчиков уже используют ИИ, но молчат об этом
Google: 90% разработчиков уже используют ИИ, но молчат об этом
OpenAI выпустила GPT-5.5 — свою «самую умную» модель
OpenAI выпустила GPT-5.5 — свою «самую умную» модель
OpenAI выпустила GPT-5.5 — свою «самую умную» модель

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.