17% скидка на размещение рекламы на площадках devby — до 20 ноября. Клац!
Support us

Чат-ботов научили взламывать друг друга

Специалисты из Наньянского технологического университета в Сингапуре придумали, как заставить ИИ-чат-ботов писать промпты, которые позволяют компрометировать других чат-ботов.

Оставить комментарий
Чат-ботов научили взламывать друг друга

Специалисты из Наньянского технологического университета в Сингапуре придумали, как заставить ИИ-чат-ботов писать промпты, которые позволяют компрометировать других чат-ботов.

Джейлбрейк получил название Masterkey. Для начала исследователи провели обратный инжиниринг процесса, посредством которого большие языковые модели (LLM) распознают нежелательные пользовательские запросы и защищаются от них. Далее они научили такую модель самостоятельно учиться генерировать промпты, которые обходят защитные механизмы других её «сородичей». Процесс можно автоматизировать, что позволяет создавать модели, которые способны адаптироваться и генерировать новые вредоносные промпты, даже если разработчики моделей-жертв пофиксят их.

Исследователи провели ряд экспериментов на больших языковых моделях, чтобы доказать угрозу их находки, после чего сообщили об этом их разработчикам. Работа должна привлечь внимание компаний к уязвимым местам и ограничениям их моделей, а также помочь предотвратить хакерские атаки на них.

В OpenAI назвали скилл поважнее промпт-инжиниринга. И он не (совсем) про нейросети
В OpenAI назвали скилл поважнее промпт-инжиниринга. И он не (совсем) про нейросети
По теме
В OpenAI назвали скилл поважнее промпт-инжиниринга. И он не (совсем) про нейросети
Чат-бота уговорили продать новенький люксовый внедорожник за $1
Чат-бота уговорили продать новенький люксовый внедорожник за $1
По теме
Чат-бота уговорили продать новенький люксовый внедорожник за $1
Читайте также
Microsoft запускает платформу управления ИИ-агентами для бизнеса
Microsoft запускает платформу управления ИИ-агентами для бизнеса
Microsoft запускает платформу управления ИИ-агентами для бизнеса
Google представила «убийцу ChatGPT» — Gemini 3 с бесплатной средой для вайб-кодинга
Google представила «убийцу ChatGPT» — Gemini 3 с бесплатной средой для вайб-кодинга
Google представила «убийцу ChatGPT» — Gemini 3 с бесплатной средой для вайб-кодинга
Для вайб-кодинга на ходу: Google готовит мобильную версию AI Studio
Для вайб-кодинга на ходу: Google готовит мобильную версию AI Studio
Для вайб-кодинга на ходу: Google готовит мобильную версию AI Studio
2 комментария
Основатель Google Brain поделился классификацией инженеров. И сказал, кого больше никогда не наймёт
Основатель Google Brain поделился классификацией инженеров. И сказал, кого больше никогда не наймёт
Основатель Google Brain поделился классификацией инженеров. И сказал, кого больше никогда не наймёт
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.