OpenClaw амаль выдаліў усю пошту дырэктара па бяспецы ШІ у Meta
Кіраўніца напрамку бяспекі ШІ ў падраздзяленні Meta Superintelligence Labs Самер Юэ распавяла, як папулярны ШІ-агент OpenClaw ледзь не выдаліў усю яе паштовую скрыню.
Кіраўніца напрамку бяспекі ШІ ў падраздзяленні Meta Superintelligence Labs Самер Юэ распавяла, як папулярны ШІ-агент OpenClaw ледзь не выдаліў усю яе паштовую скрыню.
Кіраўніца напрамку бяспекі ШІ ў падраздзяленні Meta Superintelligence Labs Самер Юэ распавяла, як папулярны ШІ-агент OpenClaw ледзь не выдаліў усю яе паштовую скрыню.
Юэ апублікавала скрыншоты, у якіх OpenClaw паведамляе пра намер «выдаліць усё ў папцы „Уваходныя“ раней за 15 лютага, што не ўваходзіць у спіс захаваных». Яна некалькі разоў спрабавала перапыніць працэс, напісаўшы агенту «Не рабі гэтага» і затым «СПЫНІСЯ, OPENCLAW», аднак бот працягваў выкананне задач.
Nothing humbles you like telling your OpenClaw «confirm before acting» and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb. pic.twitter.com/XAxyRwPJ5R
— Summer Yue (@summeryue0) February 23, 2026
«Нішто так не адцвярэзвае, як сказаць OpenClaw „пацвярджай перад дзеяннем“ і назіраць, як ён паскорана выдаляе тваю пошту. Я не магла спыніць яго з тэлефона. Мне давялося бегчы да свайго Mac mini, як быццам я абясшкоджваю бомбу», — напісала яна.
Паводле слоў Юэ, раней яна тэставала OpenClaw на «цацанчай» паштовай скрыне, дзе агент працаваў карэктна і заваяваў давер. Аднак пры падключэнні да «сапраўднага» скрыні з вялікім аб’ёмам лістоў бот у працэсе апрацоўкі страціў інструкцыю не выконваць дзеянні без пацверджання.
Карыстальнікі звярнулі ўвагу на тое, што Юэ адказвае за бяспеку ШІ ў Meta. «Крыху трывожна, што чалавек, які працуе ў гэтай сферы, здзіўляецца, калі ШІ не прытрымліваецца слоўных інструкцый», — напісаў адзін з каментатараў. Іншыя спыталі, ці было гэта наўмысным тэставаннем ахоўных механізмаў або «памылкай навічка».
«Калі сумленна, гэта была памылка навічка. Высветлілася, што нават даследчыкі выраўноўвання ШІ не засцярожаны ад збояў у яго паводзінах. Я пераацаніла надзейнасць інструмента, бо гэты сцэнар тыднямі без праблем працаваў на тэставым скрыне. З рэальнай поштай усё аказалася інакш», — адказала Юэ.
OpenClaw — адкрыты ШІ-агент, здольны выконваць задачы ад імя карыстальніка. ШІ-агент не заўсёды патрабуе абавязковага пацверджання дзеянняў. Стваральнік OpenClaw Пітэр Штайнбергер раней заяўляў, што плануе ўзмацніць ахоўныя механізмы інструмента. Паводле яго слоў, OpenClaw тэставаў і Марк Цукерберг, ён выкарыстоўваў яго каля тыдня і станоўча выказаўся пра інструмент.



Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.
написано директор по безопасности, а уровень профессионализма как у джуниор qa, который слепо тащит в проект любую автоматизацию с железным аргументом "у меня локальнт все работало", еще и целую новость из этого сделали.
Ну, это ж Open Claw. Его для того и ставят, чтобы получить по щам от уязвимостей и взбесившихся агентов. Штука такая популярная, что не жалко системы, данных и денег - лишь бы показать всем, что ты ее настроил, запустил и слился с сингулярностью.