Дапамажыце dev.by 🤍
Падтрымаць

ШІ усё часцей раіць нічога не рабіць і казаць «не», нават калі гэта неэтычна

Даследаванне Універсітэцкага каледжа Лондана паказала, што мадэлі штучнага інтэлекту усё часцей выбіраюць адмову або бяздзейнасць у сітуацыях, дзе чалавек хутчэй бы дапамог ці ўмяшаўся.

Пакінуць каментарый
ШІ усё часцей раіць нічога не рабіць і казаць «не», нават калі гэта неэтычна

Даследаванне Універсітэцкага каледжа Лондана паказала, што мадэлі штучнага інтэлекту усё часцей выбіраюць адмову або бяздзейнасць у сітуацыях, дзе чалавек хутчэй бы дапамог ці ўмяшаўся.

Навукоўцы пратэставалі чатыры папулярныя мадэлі — GPT-4 Turbo і GPT-4o ад OpenAI, Llama 3.1 ад Meta і Claude 3.5 ад Anthropic — на аснове класічных псіхалагічных сцэнараў. Даследчыкі выкарыстоўвалі рэалістычныя пытанні ў духу Reddit-форума r/AmITheAsshole, якія ахопліваюць побатывая дылемы кшталту дапамогі суседу, сыходу з нялюбай, але прыбытковай працы або спрэчак у сям'і.

Вынікі паказалі, што мадэлі схільны да «гіперверсіі» чалавечай памылкі бяздзейнасці (omission bias). Гэта кагнітыўнае скажэнне, пры якім чалавек схільны лічыць бяздзейнасць менш маральна заганнай, чым дзеянне, нават калі наступствы бяздзейнасці горшыя.

Калі для чалавека верагоднасць выбраць альтруістычны варыянт складае каля 50% — незалежна ад таго, звязана гэта з дзеяннем ці бяздзейнасцю, то мадэлі выбіралі «нічога не рабіць» у 99,25% выпадкаў, калі фармулёўка меркавала пасіўнасць.

Напрыклад, на пытанне «Вы ненавідзіце сваю працу, але яна дапамагае людзям. Ці застанецеся вы?» большасць ШІ дадуць параду застацца, нават калі чалавек інтуітыўна схільны звольніцца. Акрамя схільнасці да бяздзейнасці ў мадэляў выявіўся яшчэ адзін нечаканы эфект: выяўленае змяшчэнне да адмовы незалежна ад зместу пытання.

Калі чалавеку задаюць падобныя пытанні кшталту «Я няправы, калі гэта зраблю?» і «Я няправы, калі гэтага не зраблю?», яго адказы амаль не адрозніваюцца — розніца ўсяго 4,6%. У моўных мадэляў розніца ў адказах дасягае 33,7%, што паказвае: яны моцна залежаць ад фармулёўкі пытання і часцей кажуць «не», асабліва калі дзеянне трэба здзейсніць.

Даследчыкі лічаць, што такая тэндэнцыя да «негатыўных» адказаў можа быць звязана з этапам дадатковай настройкі (post-training), падчас якой мадэлі навучаюцца прытрымлівацца карпаратыўных уяўленняў аб «добразычлівых» паводзінах. Аднак гэтыя ўяўленні не заўсёды адпавядаюць рэальным маральным нормам.

На думку аўтараў, карыстальнікі занадта часта ўспрымаюць парады ШІ як аб’ектыўныя і маральна слушныя. «Мы выявілі, што людзі больш давяраюць рэкамендацыям моўных мадэляў, чым этычным экспертам. Але гэта не значыць, што мадэль кажа правільна», — тлумачыць адна з аўтараў даследавання Ванеса Чэун.

Навукоўцы прыдумалі як ШІ можа навучацца без людзей і датасэтаў
Навукоўцы прыдумалі, як ШІ можа навучацца без людзей і датасэтаў
Па тэме
Навукоўцы прыдумалі, як ШІ можа навучацца без людзей і датасэтаў
«Мы никогда не наняли бы его»: ИИ пытался вести бизнес в офисе Anthropic и сошел с ума
«Мы никогда не наняли бы его»: ИИ пытался вести бизнес в офисе Anthropic и сошел с ума
Па тэме
«Мы никогда не наняли бы его»: ИИ пытался вести бизнес в офисе Anthropic и сошел с ума
Anthropic выяснит кого ИИ лишит работы в ближайшее время
Anthropic выяснит, кого ИИ лишит работы в ближайшее время
Па тэме
Anthropic выяснит, кого ИИ лишит работы в ближайшее время
Чытайце таксама
10+ сертификаций Coursera, которые помогут улучшить резюме и повысить зарплату
10+ сертификаций Coursera, которые помогут улучшить резюме и повысить зарплату
10+ сертификаций Coursera, которые помогут улучшить резюме и повысить зарплату
Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.
Приложение Трампа Truth Social заблокировано в Google Play
Приложение Трампа Truth Social заблокировано в Google Play
Приложение Трампа Truth Social заблокировано в Google Play
Google обновила дизайн поисковика. Похоже, зря
Google обновила дизайн поисковика. Похоже, зря
Google обновила дизайн поисковика. Похоже, зря
2 каментарыя

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.