Николай Чикишев world 8 июня 2026, 10:59

В ChatGPT заработал «режим изоляции» для защиты от промпт-инъекций

OpenAI запускает Lockdown Mode — новый режим повышенной безопасности в ChatGPT. Он должен снизить риск утечки чувствительных данных при промпт-инъекциях.

Оставить комментарий

В ChatGPT заработал «режим изоляции» для защиты от промпт-инъекций

OpenAI запускает Lockdown Mode — новый режим повышенной безопасности в ChatGPT. Он должен снизить риск утечки чувствительных данных при промпт-инъекциях.

Промпт-инъекции особенно опасны для ИИ-агентов и инструментов с доступом к внешним сервисам. Если модель читает зараженный текст, она может начать выполнять скрытые инструкции злоумышленника — например, попытаться передать данные или изменить поведение ответа.

Lockdown Mode ограничивает такие риски за счет отключения части сетевых функций. В этом режиме ChatGPT не сможет использовать онлайн-поиск в реальном времени, режим глубокого исследования и агентный режим, загружать файлы из интернета для анализа, получать изображения из веба и давать Canvas-коду доступ к сети.

При этом режим не отключает все возможности ChatGPT. Пользователь по-прежнему может загружать свои файлы вручную, генерировать изображения, пользоваться памятью и обычными ответами модели. Также Lockdown Mode не влияет на сетевой доступ в Codex.

OpenAI указывает, что Lockdown Mode не предназначен для всех пользователей. Он рассчитан прежде всего на людей и организации, которые работают с чувствительными данными и хотят снизить риск их вывода через внешние запросы.

Компания также предупреждает, что режим не защищает от всех промпт-инъекций. Вредоносная инструкция все равно может находиться, например, в загруженном пользователем файле или в кэшированном веб-контенте. В таком случае она может повлиять на поведение модели или точность ответа, даже если не сможет так же легко отправить данные наружу.

Lockdown Mode постепенно появляется в настройках безопасности личных аккаунтов и аккаунтов ChatGPT Business, которые пользователи подключают самостоятельно. В управляемых рабочих пространствах администраторы смогут настраивать доступ через роли и корпоративные политики.