Support us

OpenAI представила модель, которая исправляет ошибки в ответах ChatGPT

OpenAI показала новую модель CriticGPT, которая ищет ошибки в коде, сгенерированном ChatGPT.

Оставить комментарий
OpenAI представила модель, которая исправляет ошибки в ответах ChatGPT

OpenAI показала новую модель CriticGPT, которая ищет ошибки в коде, сгенерированном ChatGPT.

Модель-критик построена на базе GPT-4. Её тренировали на наборе фрагментов кода, в который были намеренно добавлены баги, чтобы она училась опознавать различные виды ошибок.

CriticGPT должна помогать людям проверять код в ответах чат-бота и подмечать ошибки, которые могли быть упущены. Критику CriticGPT человеческой аннотаторы предпочитали в 63% случаев. А команды, использующие модель, писали более качественные отзывы по сравнению с теми, которые работали самостоятельно.

Также разработчики создали новую технику под названием Force Sampling Beam Search (FSBS), благодаря которой CriticGPT способна писать более подробные ревью кода. Она позволяет контролировать тщательность поиска и то, как часто модель выдумывает проблемы, которых на самом деле нет.

OpenAI представила модель GPT-4o — она «умнее» предыдущей и доступна бесплатно
OpenAI представила модель GPT-4o — она «умнее» предыдущей и доступна бесплатно
По теме
OpenAI представила модель GPT-4o — она «умнее» предыдущей и доступна бесплатно

CriticGPT в перспективе может работать не только с кодом. Исследователи опробовали модель на наборе обучающих данных ChatGPT, которые «кожаными» проверяющими были оценены как безупречные. CriticGPT нашла ошибки в них в 24% случаев, и эти ошибки подтвердили проверяющие.

Впрочем, у CriticGPT, как и у прочих ИИ-моделей, случаются галлюцинации. Она обучалась на относительно небольших ответах ChatGPT и может быть не готова к работе с более длинными и сложными задачами, с которыми столкнутся ИИ-системы в будущем. Ошибки в ответах также могут случаться и из-за некачественной разметки данных людьми.

Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
По теме
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
OpenAI отключит API для китайских компаний — местные конкуренты уже ждут наплыв клиентов
OpenAI отключит API для китайских компаний — местные конкуренты уже ждут наплыв клиентов
По теме
OpenAI отключит API для китайских компаний — местные конкуренты уже ждут наплыв клиентов
16 лет dev.by — «дефолтный» источник информации о беларусском ИТ

Вы можете...

Читайте также
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
3 комментария
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
2 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.