У ChatGPT запрацаваў «рэжым ізаляцыі» для абароны ад промпт-ін'екцый
OpenAI запускае Lockdown Mode — новы рэжым павышанай бяспекі ў ChatGPT. Ён павінен знізіць рызыку ўцечкі адчувальных звестак пры промпт-ін’екцыях.
OpenAI запускае Lockdown Mode — новы рэжым павышанай бяспекі ў ChatGPT. Ён павінен знізіць рызыку ўцечкі адчувальных звестак пры промпт-ін’екцыях.
OpenAI запускае Lockdown Mode — новы рэжым павышанай бяспекі ў ChatGPT. Ён павінен знізіць рызыку ўцечкі адчувальных звестак пры промпт-ін’екцыях.
Промпт-ін’екцыі асабліва небяспечныя для ШІ-агентаў ды інструментаў з доступам да знешніх сервісаў. Калі мадэль чытае заражаны тэкст, яна можа пачаць выконваць схаваныя інструкцыі зламысніка — напрыклад, паспрабаваць перадаць дадзеныя або змяніць паводзіны адказу.
Lockdown Mode абмяжоўвае такія рызыкі за кошт адключэння часткі сеткавых функцый. У гэтым рэжыме ChatGPT не зможа выкарыстоўваць онлайн-пошук у рэальным часе, рэжым глыбокага даследавання і агентны рэжым, загружаць файлы з інтэрнэту для аналізу, атрымліваць выявы з вэба і даваць Canvas-коду доступ да сеткі.
Пры гэтым рэжым не адключае ўсе магчымасці ChatGPT. Карыстальнік па-ранейшаму можа загружаць свае файлы ўручную, генераваць выявы, карыстацца памяццю і звычайнымі адказамі мадэлі. Таксама Lockdown Mode не ўплывае на сеткавы доступ у Codex.
OpenAI паказвае, што Lockdown Mode не прызначаны для ўсіх карыстальнікаў. Ён разлічаны перш за ўсё на людзей і арганізацыі, якія працуюць з адчувальнымі дадзенымі і хочуць знізіць рызыку іх вываду праз вонкавыя запыты.
Кампанія таксама папярэджвае, што рэжым не абараняе ад усіх промпт-ін’екцый. Шкодная інструкцыя ўсё роўна можа знаходзіцца, напрыклад, у загружаным карыстальнікам файле або ў кэшаваным вэб-кантэнце. У такім выпадку яна можа паўплываць на паводзіны мадэлі або дакладнасць адказу, нават калі не зможа гэтак жа лёгка адправіць дадзеныя вонкі.
Lockdown Mode паступова з’яўляецца ў наладах бяспекі асабістых акаўнтаў і акаўнтаў ChatGPT Business, якія карыстальнікі падключаюць самастойна. У кіраваных працоўных прасторах адміністратары змогуць наладжваць доступ праз ролі і карпаратыўныя палітыкі.



Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.