Живете в Польше? Поддержите devby 1,5% налога: бесплатно и за 5 минут 🤗
Support us

OpenAI представила модель, которая исправляет ошибки в ответах ChatGPT

OpenAI показала новую модель CriticGPT, которая ищет ошибки в коде, сгенерированном ChatGPT.

Оставить комментарий
OpenAI представила модель, которая исправляет ошибки в ответах ChatGPT

OpenAI показала новую модель CriticGPT, которая ищет ошибки в коде, сгенерированном ChatGPT.

Модель-критик построена на базе GPT-4. Её тренировали на наборе фрагментов кода, в который были намеренно добавлены баги, чтобы она училась опознавать различные виды ошибок.

CriticGPT должна помогать людям проверять код в ответах чат-бота и подмечать ошибки, которые могли быть упущены. Критику CriticGPT человеческой аннотаторы предпочитали в 63% случаев. А команды, использующие модель, писали более качественные отзывы по сравнению с теми, которые работали самостоятельно.

Также разработчики создали новую технику под названием Force Sampling Beam Search (FSBS), благодаря которой CriticGPT способна писать более подробные ревью кода. Она позволяет контролировать тщательность поиска и то, как часто модель выдумывает проблемы, которых на самом деле нет.

OpenAI представила модель GPT-4o — она «умнее» предыдущей и доступна бесплатно
OpenAI представила модель GPT-4o — она «умнее» предыдущей и доступна бесплатно
По теме
OpenAI представила модель GPT-4o — она «умнее» предыдущей и доступна бесплатно

CriticGPT в перспективе может работать не только с кодом. Исследователи опробовали модель на наборе обучающих данных ChatGPT, которые «кожаными» проверяющими были оценены как безупречные. CriticGPT нашла ошибки в них в 24% случаев, и эти ошибки подтвердили проверяющие.

Впрочем, у CriticGPT, как и у прочих ИИ-моделей, случаются галлюцинации. Она обучалась на относительно небольших ответах ChatGPT и может быть не готова к работе с более длинными и сложными задачами, с которыми столкнутся ИИ-системы в будущем. Ошибки в ответах также могут случаться и из-за некачественной разметки данных людьми.

Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
По теме
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
OpenAI отключит API для китайских компаний — местные конкуренты уже ждут наплыв клиентов
OpenAI отключит API для китайских компаний — местные конкуренты уже ждут наплыв клиентов
По теме
OpenAI отключит API для китайских компаний — местные конкуренты уже ждут наплыв клиентов
🎊 Dzik Pic Store открыт и готов принимать заказы!

Заходи к нам в магазин

Читайте также
ИИ сократит не всех: учёные вспомнили об одном важном факторе
ИИ сократит не всех: учёные вспомнили об одном важном факторе
ИИ сократит не всех: учёные вспомнили об одном важном факторе
Как чат-боты подталкивают к неверным решениям — исследование
Как чат-боты подталкивают к неверным решениям — исследование
Как чат-боты подталкивают к неверным решениям — исследование
Кофаундер a16z: катастрофа — не то, что ИИ отберёт работу, а то, что случилось бы, если бы его не было
Кофаундер a16z: катастрофа — не то, что ИИ отберёт работу, а то, что случилось бы, если бы его не было
Кофаундер a16z: катастрофа — не то, что ИИ отберёт работу, а то, что случилось бы, если бы его не было
Reddit для ИИ-агентов: в новой соцсети можно наблюдать, как боты общаются между собой
Reddit для ИИ-агентов: в новой соцсети можно наблюдать, как боты общаются между собой
Reddit для ИИ-агентов: в новой соцсети можно наблюдать, как боты общаются между собой

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.