🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

Google, Microsoft и Anthropic пытаются защитить ИИ от промпт-инъекций

Компании объединили усилия по борьбе с новой угрозой для ИИ — так называемыми атаками с инъекциями промптов (indirect prompt injection). Этот тип взлома позволяет злоумышленникам манипулировать ответами нейросетей, не имея прямого доступа к системе.

Оставить комментарий
Google, Microsoft и Anthropic пытаются защитить ИИ от промпт-инъекций

Компании объединили усилия по борьбе с новой угрозой для ИИ — так называемыми атаками с инъекциями промптов (indirect prompt injection). Этот тип взлома позволяет злоумышленникам манипулировать ответами нейросетей, не имея прямого доступа к системе.

Большинство современных языковых моделей остаются уязвимыми к подобным атакам: они не всегда различают, где заканчиваются данные и начинаются инструкции. В результате ИИ может выполнять вредоносные запросы, например, раскрывать конфиденциальные сведения, обходить фильтры или изменять поведение системы.

В отличие от традиционных хакерских атак, инъекция происходит через контекст, например, если злоумышленник встроит в текст, изображение или ссылку скрытую команду, которую ИИ ошибочно воспримет как инструкцию. Такие методы особенно опасны, поскольку они эксплуатируют саму логику работы моделей.

Компании решили действовать совместно, чтобы повысить устойчивость ИИ-систем к подобным манипуляциям: Google DeepMind разрабатывает инструменты раннего обнаружения уязвимостей, Anthropic сосредоточена на вопросах этики и безопасности, а Microsoft внедряет новые протоколы защиты в облачные и корпоративные продукты.

Атаки с промпт-инъекциями уже включены в список ключевых угроз для генеративного ИИ, отмечают аналитики IBM и Solo.io. Разработчики призывают внедрять постоянный мониторинг входных данных и изолировать внешние источники информации, чтобы минимизировать риск заражения «контекстным кодом».

Эксперты считают, что вопрос безопасности ИИ становится критическим по мере того, как технологии проникают в финансы, медицину, образование и другие чувствительные сферы. Ошибка или уязвимость в модели может привести к масштабным утечкам данных или подрыву доверия пользователей.

OpenAI представила ИИ-агента для поиска и исправления уязвимостей в коде
OpenAI представила ИИ-агента для поиска и исправления уязвимостей в коде
По теме
OpenAI представила ИИ-агента для поиска и исправления уязвимостей в коде
Youtube удаляет ролики без объяснений. Блогеры подозревают ИИ
Youtube удаляет ролики без объяснений. Блогеры подозревают ИИ 
По теме
Youtube удаляет ролики без объяснений. Блогеры подозревают ИИ
В ИИ появилась новая «золотая» профессия: спрос на неё вырос на 800% за год
В ИИ появилась новая «золотая» профессия: спрос на неё вырос на 800% за год
По теме
В ИИ появилась новая «золотая» профессия: спрос на неё вырос на 800% за год
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Студенты уже начали менять специальности из-за ИИ, половина — задумывались
Студенты уже начали менять специальности из-за ИИ, половина — задумывались
Студенты уже начали менять специальности из-за ИИ, половина — задумывались
Главная ошибка CEO в работе с ИИ — мнение эксперта
Главная ошибка CEO в работе с ИИ — мнение эксперта
Главная ошибка CEO в работе с ИИ — мнение эксперта
«Это не карьерная лестница, а стена»: топ LinkedIn о будущем карьеры в эпоху ИИ
«Это не карьерная лестница, а стена»: топ LinkedIn о будущем карьеры в эпоху ИИ
«Это не карьерная лестница, а стена»: топ LinkedIn о будущем карьеры в эпоху ИИ
Slack обновили по-крупному — более 30 новых ИИ-функций
Slack обновили по-крупному — более 30 новых ИИ-функций
Slack обновили по-крупному — более 30 новых ИИ-функций
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.