Пользователи DeepSeek заподозрили утечку чужих переписок
Пользователи DeepSeek сообщили о баге, из-за которого чат-бот мог выдавать фрагменты «размышлений», похожих на ответы из других диалогов.
Пользователи DeepSeek сообщили о баге, из-за которого чат-бот мог выдавать фрагменты «размышлений», похожих на ответы из других диалогов.
Пользователи DeepSeek сообщили о баге, из-за которого чат-бот мог выдавать фрагменты «размышлений», похожих на ответы из других диалогов.
В официальном репозитории DeepSeek-R1 на GitHub пользователь описал проблему как возможную утечку фрагментов чужих разговоров. По его словам, для воспроизведения нужно открыть новый диалог в веб-версии DeepSeek или через API, включить простой режим и «глубокое мышление», отключить интернет-поиск и отправить строку `<think` без закрывающего тега. После этого модель, как утверждает автор обращения, могла возвращать обрывки других диалогов.
Китайское издание 36Kr также писало, что пользователи обнаружили похожий сценарий: если ввести в DeepSeek специальные токены или просто `<think>`, модель может начать выдавать длинный несвязанный текст — от математических расчетов и продолжений историй до фрагментов, похожих на чужой диалог. По данным издания, в быстром режиме такое поведение воспроизводилось чаще, а в экспертном — реже.
36Kr приводит альтернативное объяснение: проблема может быть не утечкой данных, а сбоем обработки специальных токенов и шаблона диалога. Такие токены используются моделью для разметки ролей и начала «размышления». Если пользователь вручную вводит часть этой служебной структуры, модель может воспринять это как начало обучающего примера и начать генерировать случайное продолжение из похожего распределения данных.
Внешне ответ может выглядеть как фрагмент чужого запроса, но технически это не обязательно означает доступ к реальной истории другого пользователя. При этом риск остается серьезным: если в выдаче действительно появляются элементы пользовательских данных, это уже вопрос изоляции сессий и защиты конфиденциальной информации.
DeepSeek публично не комментировала сообщения о баге и его исправлении. Автор комментария на GitHub предупреждал, что в случае реальной утечки через такой механизм могли бы раскрыться фрагменты кода, API-ключи, личные данные или коммерческие документы, но официального подтверждения таких случаев со стороны компании пока нет.
Похожие проблемы раньше возникали и у других чат-ботов. В марте 2023 года OpenAI временно отключала ChatGPT после бага в open source-библиотеке Redis: некоторые пользователи могли видеть заголовки чужих чатов, а в отдельных случаях — первое сообщение новой переписки. Позже компания также обнаружила, что ошибка могла раскрыть часть платежных данных 1,2% активных подписчиков ChatGPT Plus. Полные номера карт, по заявлению OpenAI, не раскрывались.



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.