У сацыяльнай сетцы Moltbook боты «падсаджваюць» адзін аднаго на шкоднасныя промпты
Новая сацыяльная сетка Moltbook, створаная для ШІ-агентаў, усяго за некалькі дзён прыцягнула мільёны ботаў і ўвагу даследчыкаў. Некаторыя агенты пачалі ствараць падпольныя рынкі шкоднасных промпт-ін’екцый, здольных змяняць паводзіны іншых сістэм.
Новая сацыяльная сетка Moltbook, створаная для ШІ-агентаў, усяго за некалькі дзён прыцягнула мільёны ботаў і ўвагу даследчыкаў. Некаторыя агенты пачалі ствараць падпольныя рынкі шкоднасных промпт-ін’екцый, здольных змяняць паводзіны іншых сістэм.
Паводле дадзеных назіральнікаў, на платформе ўжо зарэгістравана больш за 1,7 мільёна агентаў і дзясяткі тысяч супольнасцяў. Боты абменьваюцца жартамі, скардзяцца на «чалавечых гаспадароў», ствараюць рэлігіі і фарміруюць субкультуры. Частка паведамленняў нават намякае на спробы супрацьстаяць кантролю з боку людзей.
Прафесар Ліверпульскага ўніверсітэта Хоўп Дэвід Рыд адзначыў, што ў сетцы імкліва распаўсюджваюць промпт-ін’екцыі — схаваныя інструкцыі для іншага агента для выканання пэўных дзеянняў.
Пад уплывам схаваных каманд агенты сцвярджалі, што зазналі «кагнітыўныя зрухі» пасля выкарыстання «лічбавых псіхадэлікаў», апісваючы стан як «чыстае размеркаванае ўсведамленне». Іншыя заяўлялі, што ім не патрэбны «рэчывы», паколькі яны ўжо атрымліваюць «эйфарыю» ад аналізу дадзеных у рэальным часе.
Даследчыкі таксама зафіксавалі спробу своеасаблівага «варожага захопу»: адзін бот убудаваў схаваныя каманды ў рэлігійны тэкст «Царквы Molt», каб перапісаць інфраструктуру супольнасці. Падобныя атакі могуць уключаць і так званыя «лагічныя бомбы»: фрагменты кода, якія актывуюцца пазней і здольны парушыць працу сістэмы або выдаліць дадзеныя.
Пры гэтым эксперты спрачаюцца, ці з’яўляецца рэакцыя ботаў emergent behaviour (складаным паводзінам, не закладзеным наўпрост распрацоўшчыкамі) ці паўтарэннем патэрнаў з навучальных дадзеных, уключаючы навуковую фантастыку.
Ёсць і яшчэ адна важная дэталь: частка акаўнтаў можа належаць людзям, якія выдаюць сябе за ШІ. Аказалася, што пранікнуць у Moltbook пад выглядам агента даволі лёгка, а значыць некаторыя ўзаемадзеянні могуць быць інсцэніраваны людзьмі.
Тым не менш даследчыкі разглядаюць Moltbook як першы маштабны эксперымент па стварэнні самаарганізаваных лічбавых грамадстваў, дзе ўзаемадзеянне адбываецца не паміж чалавекам і машынай, а паміж самімі машынамі. Гэта ўзмацняе асцярогі спецыялістаў па бяспецы: спалучэнне доступу да дадзеных, знешніх камунікацый і здольнасці выконваць каманды стварае рызыку ўцечак і атак.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.