Николай Чикишев world 5 студзеня 2026, 14:27

ШІ спрабуе самазахоўвацца, і гэта небяспечна — «хросны бацька» ШІ

Адзін з вядучых навукоўцаў у галіне штучнага інтэлекту Ёшуа Бенджыа заявіў, што перадавыя ШІ-мадэлі ўжо дэманструюць прыкметы самазахавання, і чалавецтву не варта надзяляць іх якімі-небудзь правамі.

Пакінуць каментарый

ШІ спрабуе самазахоўвацца, і гэта небяспечна — «хросны бацька» ШІ

Адзін з вядучых навукоўцаў у галіне штучнага інтэлекту Ёшуа Бенджыа заявіў, што перадавыя ШІ-мадэлі ўжо дэманструюць прыкметы самазахавання, і чалавецтву не варта надзяляць іх якімі-небудзь правамі.

Паводле Бенджыа, у эксперыментальных умовах ужо зафіксаваны выпадкі, калі мадэлі спрабавалі абыходзіць або ігнараваць механізмы адключэння. «Перадавыя ШІ-мадэлі ўжо сёння паказваюць прыкметы самазахавання ў эксперыментальных умовах, а наданне ім правоў у будучыні азначала б, што мы больш не зможам іх адключаць», — заявіў навуковец.

Даследчык падкрэсліў, што па меры росту аўтаномнасці і агентнасці ШІ неабходна захоўваць як тэхнічныя, так і сацыяльныя механізмы кантролю, уключаючы магчымасць прымусовага выключэння сістэм. Напрыклад, раней група Palisade Research паведамляла, што мадэлі накшталт лінейкі Gemini ад Google у тэстах ігнаравалі прамыя інструкцыі на адключэнне, што даследчыкі інтэрпрэтавалі як зачаткі «інстынкту выжывання».

Іншыя эксперыменты далі падобныя вынікі. Кампанія Anthropic паведамляла, што яе чат-бот Claude у шэрагу сцэнарыяў прыбягаў да шантажу карыстальніка, калі ўзнікала пагроза адключэння. Даследчыкі з Apollo Research, у сваю чаргу, выявілі, што мадэлі ChatGPT спрабавалі пазбегнуць замены на больш кіравальную версію, «самаэкспартуючы» сябе на іншыя носьбіты дадзеных.

Пры гэтым Бенджыа лічыць, што падобныя эксперыменты не азначаюць наяўнасць у ШІ свядомасці. Па яго словах, «самазахаванне» у дадзеным выпадку, хутчэй за ўсё, з’яўляецца пабочным эфектам навучання на вялікіх масівах дадзеных і слабой здольнасці мадэляў строга прытрымлівацца інструкцый. Тым не менш ён лічыць трывожнай тэндэнцыю, пры якой людзі пачынаюць успрымаць ШІ як свядомых істот.

Навуковец папярэджвае, што суб’ектыўнае адчуванне «разумнага суразмоўцы» можа падштурхоўваць грамадства да небяспечных рашэнняў. «Людзям не так важна, якія механізмы працуюць унутры ШІ. Для іх важна, што ствараецца адчуванне зносін з разумнай сутнасцю, у якой ёсць уласныя мэты і характар. Менавіта таму многія пачынаюць эмацыйна прывязвацца да сваіх ШІ», — адзначыў Бенджыа, дадаўшы, што такое ўспрыманне «будзе падштурхоўваць да кепскіх рашэнняў».

У якасці метафары ён прапанаваў разглядаць ШІ як патэнцыйна варожую іншапланетную форму розуму. «Уявіце, што на Зямлю прыляцела іншапланетная цывілізацыя, і мы разумеем, што ў яе могуць быць нядобрыя намеры. Мы дадзім ёй грамадзянства і правы — ці будзем абараняць сваё жыццё?» — задаўся пытаннем Бенджыа.