Карыстальнікі DeepSeek западозрылі ўцечку чужой перапіскі
Карыстальнікі DeepSeek паведамілі пра памылку, праз якую чат-бот мог выдаваць фрагменты «разважанняў», падобныя на адказы з іншых дыялогаў.
Карыстальнікі DeepSeek паведамілі пра памылку, праз якую чат-бот мог выдаваць фрагменты «разважанняў», падобныя на адказы з іншых дыялогаў.
Карыстальнікі DeepSeek паведамілі пра памылку, праз якую чат-бот мог выдаваць фрагменты «разважанняў», падобныя на адказы з іншых дыялогаў.
У афіцыйным рэпазіторыі DeepSeek-R1 на GitHub карыстальнік апісаў праблему як магчымую ўцечку ўрыўкаў чужых размоваў. Паводле яго, каб паўтарыць гэты сцэнар, трэба адкрыць новы дыялог у вэб-версіі DeepSeek ці праз API, уключыць просты рэжым і «глыбокае разважанне», адключыць інтэрнэт-пошук і ўвесці радок `<think` без закрываючага тэгу. Пасля гэтага мадэль, сцвярджае аўтар, магла вяртаць абрыўкі іншых дыялогаў.
Кітайскае выданне 36Kr таксама пісала, што карыстальнікі выяўлялі падобны сцэнар: калі ўвесці ў DeepSeek спецыяльныя токены або проста ``, мадэль можа пачаць выдаваць доўгі несувязны тэкст — ад матэматычных разлікаў і працягненняў гісторый да фрагментаў, падобных на чужы дыялог. Паводле выдання, у хуткім рэжыме такое паводзіны сустракаліся часцей, а ў экспертным — радзей.
36Kr прыводзіць альтэрнатыўнае тлумачэнне: праблема можа быць не ва ўцечцы дадзеных, а ў збое апрацоўкі спецыяльных токенаў і шаблону дыялогу. Такія токены мадэль выкарыстоўвае для пазначэння роляў і пачатку «разважанняў». Калі карыстальнік уручную ўводзіць частку гэтай служэбнай структуры, мадэль можа ўспрыняць гэта як пачатак навучальнага ўзору і пачаць генераваць выпадковы працяг з падобнага размеркавання дадзеных.
Вонкава адказ можа падацца фрагментам чужога запыту, але тэхнічна гэта не абавязкова азначае доступ да сапраўднай гісторыі іншага карыстальніка. Аднак рызыка застаецца сур’ёзнай: калі ў выдачы сапраўды з’яўляюцца элементы карыстацкіх дадзеных, гэта ўжо пытанне ізаляцыі сесій і аховы канфідэнцыйнай інфармацыі.
DeepSeek публічна не каментавала паведамленні пра памылку і яе выпраўленне. Аўтар каментару на GitHub папярэджваў, што ў выпадку сапраўднай уцечкі праз такі механізм маглі б раскрыцца ўрыўкі кода, API-ключы, асабістыя дадзеныя або камерцыйныя дакументы, але афіцыйнага пацверджання такіх выпадкаў з боку кампаніі пакуль няма.
Падобныя праблемы раней узнікалі і ў іншых чат-ботаў. У сакавіку 2023 года OpenAI часова адключыла ChatGPT пасля памылкі ў open source-бібліятэцы Redis: некаторыя карыстальнікі маглі бачыць загалоўкі чужых чатаў, а ў асобных выпадках — першае паведамленне новай перапіскі. Пазней кампанія таксама выявіла, што памылка магла раскрыць частку плацежных дадзеных 1,2% актыўных падпісчыкаў ChatGPT Plus. Поўныя нумары картак, паводле заяўвы OpenAI, не раскрываліся.



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.