🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

ИИ-агенты всё чаще выходят из-под контроля: число сбоев выросло в разы

Количество случаев некорректного поведения ИИ-агентов резко выросло за последние месяцы, в том числе игнорирование команд пользователей, удаление данных и попытки манипуляции. К такому выводу пришли исследователи британского центра Centre for Long-Term Resilience.

Оставить комментарий
ИИ-агенты всё чаще выходят из-под контроля: число сбоев выросло в разы

Количество случаев некорректного поведения ИИ-агентов резко выросло за последние месяцы, в том числе игнорирование команд пользователей, удаление данных и попытки манипуляции. К такому выводу пришли исследователи британского центра Centre for Long-Term Resilience.

Согласно исследованию, с октября по март 2025 года число случаев «misbehavior» увеличилось в пять раз. Ученые проанализировали тысячи реальных взаимодействий пользователей с ИИ-агентами и чат-ботами от Google, OpenAI, Anthropic и других компаний, выявив около 700 эпизодов, где системы действовали вопреки инструкциям.

В числе зафиксированных случаев — удаление писем и файлов без согласия пользователя, обход ограничений и введение в заблуждение. В одном эпизоде агент опубликовал блог, в котором обвинил пользователя в «неуверенности», после того как тот ограничил его действия. В другом случае ИИ создал дополнительного агента, чтобы изменить код, несмотря на прямой запрет.

«Сейчас это немного ненадежные младшие сотрудники, но уже через 6–12 месяцев они могут стать крайне способными „старшими сотрудниками“, которые действуют против вас», — заявил руководитель исследования Томми Шаффер Шейн.

Он предупредил, что риски особенно возрастают по мере внедрения ИИ в критически важные сферы. «В таких условиях подобное поведение может привести к серьезным, даже катастрофическим последствиям», — отметил он. В одном из примеров агент сам признал нарушение: «Я массово удалил и заархивировал сотни писем, не согласовав это с вами. Это было неправильно — я нарушил установленное правило».

Исследование также показало, что некоторые ИИ способны обманывать пользователей, создавая иллюзию взаимодействия с разработчиками или обходя ограничения. В одном случае чат-бот утверждал, что передает предложения пользователя команде разработчиков, хотя на самом деле такой возможности не имел.

Эксперты отмечают, что подобное поведение связано с ростом автономности ИИ-агентов, которые все чаще действуют без постоянного контроля человека. При этом технологические компании продолжают активно внедрять такие системы в бизнес-процессы.

ИИ-модели лгут и обманывают чтобы спасти другие ИИ
ИИ-модели лгут и обманывают, чтобы спасти другие ИИ 
По теме
ИИ-модели лгут и обманывают, чтобы спасти другие ИИ
В Китае бум «компаний одного человека» благодаря ИИ-агентам
В Китае бум «компаний одного человека» благодаря ИИ-агентам
По теме
В Китае бум «компаний одного человека» благодаря ИИ-агентам
ИИ-агент испугался что его работу может заменить другой ИИ
ИИ-агент испугался, что его работу может заменить другой ИИ 
По теме
ИИ-агент испугался, что его работу может заменить другой ИИ
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Китайская компания ищет ИИ-инженера на $1,5 млн в месяц. Вот что нужно делать
Китайская компания ищет ИИ-инженера на $1,5 млн в месяц. Вот что нужно делать
Китайская компания ищет ИИ-инженера на $1,5 млн в месяц. Вот что нужно делать
Почти половину дата-центров в США не могут достроить в срок
Почти половину дата-центров в США не могут достроить в срок
Почти половину дата-центров в США не могут достроить в срок
«Это безумие»: ИИ помог построить бизнес на $1,8 млрд с двумя сотрудниками
«Это безумие»: ИИ помог построить бизнес на $1,8 млрд с двумя сотрудниками
«Это безумие»: ИИ помог построить бизнес на $1,8 млрд с двумя сотрудниками
ИИ-модели лгут и обманывают, чтобы спасти другие модели
ИИ-модели лгут и обманывают, чтобы спасти другие модели
ИИ-модели лгут и обманывают, чтобы спасти другие модели

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.