В ChatGPT заработал «режим изоляции» для защиты от промпт-инъекций
OpenAI запускает Lockdown Mode — новый режим повышенной безопасности в ChatGPT. Он должен снизить риск утечки чувствительных данных при промпт-инъекциях.
OpenAI запускает Lockdown Mode — новый режим повышенной безопасности в ChatGPT. Он должен снизить риск утечки чувствительных данных при промпт-инъекциях.
OpenAI запускает Lockdown Mode — новый режим повышенной безопасности в ChatGPT. Он должен снизить риск утечки чувствительных данных при промпт-инъекциях.
Промпт-инъекции особенно опасны для ИИ-агентов и инструментов с доступом к внешним сервисам. Если модель читает зараженный текст, она может начать выполнять скрытые инструкции злоумышленника — например, попытаться передать данные или изменить поведение ответа.
Lockdown Mode ограничивает такие риски за счет отключения части сетевых функций. В этом режиме ChatGPT не сможет использовать онлайн-поиск в реальном времени, режим глубокого исследования и агентный режим, загружать файлы из интернета для анализа, получать изображения из веба и давать Canvas-коду доступ к сети.
При этом режим не отключает все возможности ChatGPT. Пользователь по-прежнему может загружать свои файлы вручную, генерировать изображения, пользоваться памятью и обычными ответами модели. Также Lockdown Mode не влияет на сетевой доступ в Codex.
OpenAI указывает, что Lockdown Mode не предназначен для всех пользователей. Он рассчитан прежде всего на людей и организации, которые работают с чувствительными данными и хотят снизить риск их вывода через внешние запросы.
Компания также предупреждает, что режим не защищает от всех промпт-инъекций. Вредоносная инструкция все равно может находиться, например, в загруженном пользователем файле или в кэшированном веб-контенте. В таком случае она может повлиять на поведение модели или точность ответа, даже если не сможет так же легко отправить данные наружу.
Lockdown Mode постепенно появляется в настройках безопасности личных аккаунтов и аккаунтов ChatGPT Business, которые пользователи подключают самостоятельно. В управляемых рабочих пространствах администраторы смогут настраивать доступ через роли и корпоративные политики.



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.