Николай Чикишев world 24 февраля 2026, 14:17

OpenClaw чуть не стёр всю почту директора по безопасности ИИ в Meta

Глава направления безопасности ИИ в подразделении Meta Superintelligence Labs Саммер Юэ рассказала, как популярный ИИ-агент OpenClaw едва не удалил весь ее почтовый ящик.

2 комментария

OpenClaw чуть не стёр всю почту директора по безопасности ИИ в Meta

Глава направления безопасности ИИ в подразделении Meta Superintelligence Labs Саммер Юэ рассказала, как популярный ИИ-агент OpenClaw едва не удалил весь ее почтовый ящик.

Юэ опубликовала скриншоты, в которых OpenClaw сообщает о намерении «удалить все в папке „Входящие“ ранее 15 февраля, что не входит в список сохраненных». Она несколько раз пыталась прервать процесс, написав агенту «Не делай этого» и затем «ОСТАНОВИСЬ, OPENCLAW», однако бот продолжал выполнение задач.

Nothing humbles you like telling your OpenClaw «confirm before acting» and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb. pic.twitter.com/XAxyRwPJ5R
— Summer Yue (@summeryue0) February 23, 2026

«Ничто так не отрезвляет, как сказать OpenClaw „подтверждай перед действием“ и наблюдать, как он ускоренно удаляет твою почту. Я не могла остановить его с телефона. Мне пришлось бежать к своему Mac mini, как будто я обезвреживаю бомбу», — написала она.

По словам Юэ, ранее она тестировала OpenClaw на «игрушечном» почтовом ящике, где агент работал корректно и завоевал доверие. Однако при подключении к «реальному» ящику с большим объемом писем бот в процессе обработки потерял инструкцию не выполнять действия без подтверждения.

Пользователи обратили внимание на то, что Юэ отвечает за безопасность ИИ в Meta. «Немного тревожно, что человек, работающий в этой сфере, удивляется, когда ИИ не следует словесным инструкциям», — написал один из комментаторов. Другие спросили, было ли это намеренным тестированием защитных механизмов или «ошибкой новичка».

«Если честно, это была ошибка новичка. Оказалось, что даже исследователи выравнивания ИИ не застрахованы от сбоев в его поведении. Я переоценила надежность инструмента, потому что этот сценарий неделями без проблем работал на тестовом ящике. С реальной почтой всё оказалось иначе», — ответила Юэ.

OpenClaw — открытый ИИ-агент, способный выполнять задачи от имени пользователя. ИИ-агент не всегда требует обязательного подтверждения действий. Создатель OpenClaw Питер Штайнбергер ранее заявлял, что планирует усилить защитные механизмы инструмента. По его словам, OpenClaw тестировал и Марк Цукерберг, он использовал его около недели и положительно высказался об инструменте.

Google банит подписчиков Gemini за подключение OpenClaw

Сделка OpenAI с OpenClaw может стать концом эпохи ChatGPT — мнение эксперта

OpenAI наняла создателя вирусного ИИ-агента OpenClaw

2 комментария

Текст: Николай Чикишев Источник: 404 Media Теги: openclaw, meta, искусственный интеллект, ии-агенты

Нашли ошибку в тексте-выделите ее и нажмите Ctrl+Enter. Нашли ошибку в тексте-выделите ее и нажмите кнопку «Сообщить об ошибке»."

Сайт компании Вакансии

Размещение рекламы

Глава разработки Anthropic рассказала, как ИИ-агенты изолируют программистов

Биотех-стартап Gero Мельничека привлёк ещё $17 млн на создание лекарств от старости

Как попасть на работу в топовую ИИ-лабораторию: совет ведущего инженера Google DeepMind

ИИ пока не лишает людей работы — изменения идут примерно теми же темпами, как и в другие технологические прорывы

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

frei

0

написано директор по безопасности, а уровень профессионализма как у джуниор qa, который слепо тащит в проект любую автоматизацию с железным аргументом "у меня локальнт все работало", еще и целую новость из этого сделали.

Alex V

0

Ну, это ж Open Claw. Его для того и ставят, чтобы получить по щам от уязвимостей и взбесившихся агентов. Штука такая популярная, что не жалко системы, данных и денег - лишь бы показать всем, что ты ее настроил, запустил и слился с сингулярностью.

Войдите, чтобы оставить комментарий