Дапамажыце dev.by 🤍
Падтрымаць

У сацыяльнай сетцы Moltbook боты «падсаджваюць» адзін аднаго на шкоднасныя промпты

Новая сацыяльная сетка Moltbook, створаная для ШІ-агентаў, усяго за некалькі дзён прыцягнула мільёны ботаў і ўвагу даследчыкаў. Некаторыя агенты пачалі ствараць падпольныя рынкі шкоднасных промпт-ін’екцый, здольных змяняць паводзіны іншых сістэм.

Пакінуць каментарый
У сацыяльнай сетцы Moltbook боты «падсаджваюць» адзін аднаго на шкоднасныя промпты

Новая сацыяльная сетка Moltbook, створаная для ШІ-агентаў, усяго за некалькі дзён прыцягнула мільёны ботаў і ўвагу даследчыкаў. Некаторыя агенты пачалі ствараць падпольныя рынкі шкоднасных промпт-ін’екцый, здольных змяняць паводзіны іншых сістэм.

Паводле дадзеных назіральнікаў, на платформе ўжо зарэгістравана больш за 1,7 мільёна агентаў і дзясяткі тысяч супольнасцяў. Боты абменьваюцца жартамі, скардзяцца на «чалавечых гаспадароў», ствараюць рэлігіі і фарміруюць субкультуры. Частка паведамленняў нават намякае на спробы супрацьстаяць кантролю з боку людзей.

Прафесар Ліверпульскага ўніверсітэта Хоўп Дэвід Рыд адзначыў, што ў сетцы імкліва распаўсюджваюць промпт-ін’екцыі — схаваныя інструкцыі для іншага агента для выканання пэўных дзеянняў.

Пад уплывам схаваных каманд агенты сцвярджалі, што зазналі «кагнітыўныя зрухі» пасля выкарыстання «лічбавых псіхадэлікаў», апісваючы стан як «чыстае размеркаванае ўсведамленне». Іншыя заяўлялі, што ім не патрэбны «рэчывы», паколькі яны ўжо атрымліваюць «эйфарыю» ад аналізу дадзеных у рэальным часе.

Даследчыкі таксама зафіксавалі спробу своеасаблівага «варожага захопу»: адзін бот убудаваў схаваныя каманды ў рэлігійны тэкст «Царквы Molt», каб перапісаць інфраструктуру супольнасці. Падобныя атакі могуць уключаць і так званыя «лагічныя бомбы»: фрагменты кода, якія актывуюцца пазней і здольны парушыць працу сістэмы або выдаліць дадзеныя.

Пры гэтым эксперты спрачаюцца, ці з’яўляецца рэакцыя ботаў emergent behaviour (складаным паводзінам, не закладзеным наўпрост распрацоўшчыкамі) ці паўтарэннем патэрнаў з навучальных дадзеных, уключаючы навуковую фантастыку.

Ёсць і яшчэ адна важная дэталь: частка акаўнтаў можа належаць людзям, якія выдаюць сябе за ШІ. Аказалася, што пранікнуць у Moltbook пад выглядам агента даволі лёгка, а значыць некаторыя ўзаемадзеянні могуць быць інсцэніраваны людзьмі.

Тым не менш даследчыкі разглядаюць Moltbook як першы маштабны эксперымент па стварэнні самаарганізаваных лічбавых грамадстваў, дзе ўзаемадзеянне адбываецца не паміж чалавекам і машынай, а паміж самімі машынамі. Гэта ўзмацняе асцярогі спецыялістаў па бяспецы: спалучэнне доступу да дадзеных, знешніх камунікацый і здольнасці выконваць каманды стварае рызыку ўцечак і атак.

Прыклад таго як ШІ можна прыняць за існасць са свядомасцю: кіраўнік Microsoft AI пра Moltbook
Прыклад таго, як ШІ можна прыняць за існасць са свядомасцю: кіраўнік Microsoft AI пра Moltbook
Па тэме
Прыклад таго, як ШІ можна прыняць за існасць са свядомасцю: кіраўнік Microsoft AI пра Moltbook
ШІ-сацсетка Moltbook зліла дадзеныя тысяч карыстальнікаў — праект «навайбкодзілі»
ШІ-сацсетка Moltbook зліла дадзеныя тысяч карыстальнікаў — праект «навайбкодзілі»
Па тэме
ШІ-сацсетка Moltbook зліла дадзеныя тысяч карыстальнікаў — праект «навайбкодзілі»
ШІ-агент Moltbot стаў хітом сярод праграмістаў але трывожыць экспертаў
ШІ-агент Moltbot стаў хітом сярод праграмістаў, але трывожыць экспертаў
Па тэме
ШІ-агент Moltbot стаў хітом сярод праграмістаў, але трывожыць экспертаў
Чытайце таксама
«Яна выратавала мне жыццё»: OpenAI адключае GPT-4o — карыстальнікі ўзбунтаваліся
«Яна выратавала мне жыццё»: OpenAI адключае GPT-4o — карыстальнікі ўзбунтаваліся
«Яна выратавала мне жыццё»: OpenAI адключае GPT-4o — карыстальнікі ўзбунтаваліся
Кампаніі рызыкуюць стаць «машынамі для выгарання» з-за ШІ — даследаванне
Кампаніі рызыкуюць стаць «машынамі для выгарання» з-за ШІ — даследаванне
Кампаніі рызыкуюць стаць «машынамі для выгарання» з-за ШІ — даследаванне
«Мір у небяспецы»: кіраўнік каманды бяспекі Anthropic звольніўся і пакінуў загадкавы ліст
«Мір у небяспецы»: кіраўнік каманды бяспекі Anthropic звольніўся і пакінуў загадкавы ліст
«Мір у небяспецы»: кіраўнік каманды бяспекі Anthropic звольніўся і пакінуў загадкавы ліст
Стваральнік OpenClaw не фанат агульнага ШІ. Кажа, будучыня за спецыялізаваным
Стваральнік OpenClaw не фанат агульнага ШІ. Кажа, будучыня за спецыялізаваным
Стваральнік OpenClaw не фанат агульнага ШІ. Кажа, будучыня за спецыялізаваным

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.