🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

GPT 5.5 запретили говорить про енотов и гоблинов. Люди стали веселиться

В коде Codex, агента OpenAI для разработчиков, обнаружилась занятная строчка: «Никогда не говори о гоблинах, гремлинах, енотах, троллях, ограх, голубях и прочих животных или существах, если это абсолютно и однозначно не относится к запросу пользователя». Строчка встречается в коде аж четыре раза.

Оставить комментарий

В коде Codex, агента OpenAI для разработчиков, обнаружилась занятная строчка: «Никогда не говори о гоблинах, гремлинах, енотах, троллях, ограх, голубях и прочих животных или существах, если это абсолютно и однозначно не относится к запросу пользователя». Строчка встречается в коде аж четыре раза.

До этого открытия пользователи с недоумением постили ответы GPT 5.5, в которые модель внезапно вворачивала животных и всякую нечисть.

Находка в коде быстро стала мемом, люди стали специально провоцировать модель, а инженеры OpenAI — извиняться, мол, «думали, что пофиксили».

Компания не осталась в стороне от веселья — строчку добавили в био ChatGPT в Х, подключился даже Сэм Альтман. Сайт Arena.ai тем временем статистически подтвердил, что гоблины в GPT 5.5 — не случайность, особенно при отключённом режиме глубокого мышления.

OpenAI вскоре опубликовала подробный разбор случившегося. Гоблины начали появляться ещё в GPT 5.1 — после её выхода в ноябре упоминания слова «goblin» выросли на 175%, «gremlin» — на 52%. Но с выходом GPT 5.4 существа расплодились настолько, что компания начала расследование. Источником проблемы оказался персонаж Nerdy (Душнила) из функции кастомизации личности: его системный промпт предписывал модели быть игривой, заумной и «признавать странность мира». Система оценки ответов, заточенная под этот стиль, непреднамеренно высоко оценивала метафоры с существами — в 76% случаев ответы с гоблинами получали более высокий балл, чем аналогичные без них. Причём на Nerdy приходилось всего 2,5% ответов ChatGPT — но 66,7% всех упоминаний слова «goblin».

Дальше сработал механизм обучения с подкреплением: поощряемый стиль просочился за пределы персонажа и начал появляться везде. В обучающих данных GPT 5.5 помимо гоблинов и гремлинов обнаружились еноты, тролли, огры и голуби. Nerdy убрали в марте после выхода GPT 5.4, проблемный сигнал оценки отключили, данные с существами отфильтровали. Но GPT 5.5 начала обучаться раньше, чем нашли корень зла. Отсюда и четырёхкратный запрет в коде Codex.

OpenAI выпустила GPT-5.5 — свою «самую умную» модель
OpenAI выпустила GPT-5.5 — свою «самую умную» модель
По теме
OpenAI выпустила GPT-5.5 — свою «самую умную» модель
Новый бенчмарк оценивает не умность моделей а количество бреда который они позволяют себе скормить
Новый бенчмарк оценивает не умность моделей, а количество бреда, который они позволяют себе скормить
По теме
Новый бенчмарк оценивает не умность моделей, а количество бреда, который они позволяют себе скормить
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
OpenAI выпустила GPT-5 Codex: лучше код-ревью, меньше ошибок
OpenAI выпустила GPT-5 Codex: лучше код-ревью, меньше ошибок
OpenAI выпустила GPT-5 Codex: лучше код-ревью, меньше ошибок
OpenAI обновила ChatGPT до GPT-5.1 — модель стала точнее и человечнее
OpenAI обновила ChatGPT до GPT-5.1 — модель стала точнее и человечнее
OpenAI обновила ChatGPT до GPT-5.1 — модель стала точнее и человечнее
1 комментарий
OpenAI выпустила GPT-5.2-Codex — агентную модель для программирования
OpenAI выпустила GPT-5.2-Codex — агентную модель для программирования
OpenAI выпустила GPT-5.2-Codex — агентную модель для программирования
Claude выбил ChatGPT с 1 места в App Store на фоне спора Anthropic с Пентагоном — два месяца назад был 42
Claude выбил ChatGPT с 1 места в App Store на фоне спора Anthropic с Пентагоном — два месяца назад был 42
Claude выбил ChatGPT с 1 места в App Store на фоне спора Anthropic с Пентагоном — два месяца назад был 42
2 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.