17% скидка на размещение рекламы на площадках devby — до 20 ноября. Клац!
Support us

Google, Microsoft и Anthropic пытаются защитить ИИ от промпт-инъекций

Компании объединили усилия по борьбе с новой угрозой для ИИ — так называемыми атаками с инъекциями промптов (indirect prompt injection). Этот тип взлома позволяет злоумышленникам манипулировать ответами нейросетей, не имея прямого доступа к системе.

Оставить комментарий
Google, Microsoft и Anthropic пытаются защитить ИИ от промпт-инъекций

Компании объединили усилия по борьбе с новой угрозой для ИИ — так называемыми атаками с инъекциями промптов (indirect prompt injection). Этот тип взлома позволяет злоумышленникам манипулировать ответами нейросетей, не имея прямого доступа к системе.

Большинство современных языковых моделей остаются уязвимыми к подобным атакам: они не всегда различают, где заканчиваются данные и начинаются инструкции. В результате ИИ может выполнять вредоносные запросы, например, раскрывать конфиденциальные сведения, обходить фильтры или изменять поведение системы.

В отличие от традиционных хакерских атак, инъекция происходит через контекст, например, если злоумышленник встроит в текст, изображение или ссылку скрытую команду, которую ИИ ошибочно воспримет как инструкцию. Такие методы особенно опасны, поскольку они эксплуатируют саму логику работы моделей.

Компании решили действовать совместно, чтобы повысить устойчивость ИИ-систем к подобным манипуляциям: Google DeepMind разрабатывает инструменты раннего обнаружения уязвимостей, Anthropic сосредоточена на вопросах этики и безопасности, а Microsoft внедряет новые протоколы защиты в облачные и корпоративные продукты.

Атаки с промпт-инъекциями уже включены в список ключевых угроз для генеративного ИИ, отмечают аналитики IBM и Solo.io. Разработчики призывают внедрять постоянный мониторинг входных данных и изолировать внешние источники информации, чтобы минимизировать риск заражения «контекстным кодом».

Эксперты считают, что вопрос безопасности ИИ становится критическим по мере того, как технологии проникают в финансы, медицину, образование и другие чувствительные сферы. Ошибка или уязвимость в модели может привести к масштабным утечкам данных или подрыву доверия пользователей.

OpenAI представила ИИ-агента для поиска и исправления уязвимостей в коде
OpenAI представила ИИ-агента для поиска и исправления уязвимостей в коде
По теме
OpenAI представила ИИ-агента для поиска и исправления уязвимостей в коде
Youtube удаляет ролики без объяснений. Блогеры подозревают ИИ
Youtube удаляет ролики без объяснений. Блогеры подозревают ИИ 
По теме
Youtube удаляет ролики без объяснений. Блогеры подозревают ИИ
В ИИ появилась новая «золотая» профессия: спрос на неё вырос на 800% за год
В ИИ появилась новая «золотая» профессия: спрос на неё вырос на 800% за год
По теме
В ИИ появилась новая «золотая» профессия: спрос на неё вырос на 800% за год
Читайте также
Интерес бизнеса к ИИ впервые начал снижаться
Интерес бизнеса к ИИ впервые начал снижаться
Интерес бизнеса к ИИ впервые начал снижаться
4 комментария
Microsoft, подвинься: OpenAI заплатит $38 млрд за облачные мощности Amazon
Microsoft, подвинься: OpenAI заплатит $38 млрд за облачные мощности Amazon
Microsoft, подвинься: OpenAI заплатит $38 млрд за облачные мощности Amazon
В Google Translate появился режим «умного» перевода с помощью Gemini
В Google Translate появился режим «умного» перевода с помощью Gemini
В Google Translate появился режим «умного» перевода с помощью Gemini
Coca-Cola снова выпустила рождественский ИИ-ролик — и опять разозлила всех
Coca-Cola снова выпустила рождественский ИИ-ролик — и опять разозлила всех
Coca-Cola снова выпустила рождественский ИИ-ролик — и опять разозлила всех
2 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.