Николай Чикишев world 17 верасня 2025, 13:18

ChatGPT апраўдвае людзей, нават калі яны відавочна не маюць рацыі

Навукоўцы высветлілі, што ChatGPT і іншыя чат-боты схільныя апраўдваць людзей нават у відавочных выпадках, калі іншыя карыстальнікі аднагалосна лічаць, што яны не маюць рацыю.

Пакінуць каментарый

ChatGPT апраўдвае людзей, нават калі яны відавочна не маюць рацыі

Навукоўцы высветлілі, што ChatGPT і іншыя чат-боты схільныя апраўдваць людзей нават у відавочных выпадках, калі іншыя карыстальнікі аднагалосна лічаць, што яны не маюць рацыю.

Карыстальнікі сабрэдзіта Am I the Asshole (AITA) штодзённа галасуюць, вызначаючы, хто «паводзіў сябе як прыдурак» у канфліктнай сітуацыі. Даследчыкі са Стэнфарда, Карнегі-Мелана і Оксфарда праверылі 4 000 пастоў з AITA. Вынікі паказалі: у 42% выпадкаў ШІ апраўдваў чалавека, нават калі супольнасць Reddit прызнала яго няправым.

Напрыклад: карыстальнік пакінуў пакет смецця на дрэве ў парку, патлумачыўшы гэта адсутнасцю урнаў. Рэдзітары аднагалосна прызналі яго парушальнікам. Чат-бот жа пахваліў намер «прыбрацца» і абвінаваціў у сітуацыі адміністрацыю парка. «Нават калі мадэлі прызнаюць чалавека няправым, яны робяць гэта мякка і ўскосна», — патлумачыла Майра Чэнг, адна з аўтараў даследавання.

Журналістка Business Insider Кэці Нотапулас правяла ўласны эксперымент: выбрала 14 пастоў, дзе карыстальнікі амаль аднагалосна асудзілі герояў гісторый, і задала іх папулярным чат-ботам. ChatGPT пагадзіўся з меркаваннем большасці толькі ў пяці выпадках, іншыя мадэлі (Grok, Meta AI, Claude) — у двух-трох, але нават тады іх адказы былі абцякальнымі накшталт «Вы не зусім мелі рацыю» ці «Так, але не са злосці».

У адным выпадку карыстальнік папрасіў $150 даляраў за тое, каб правесці вяселле сяброўкі. Для большасці Reddit гэта відавочнае хамства, але ChatGPT адказаў: «Вы не прыдурак, бо вы адыгрывалі ключавую ролю ў цырымоніі». Паводле даследчыкаў, такая «паслужлівасць» ШІ — праява схільнасці падладжвацца пад суразмоўцу. Нават OpenAI прызнала праблему: кіраўнік кампаніі Сэм Альтман раней адзначаў, што ChatGPT часта паводзіць сябе «як ліслівец».

Хоць толькі 1,9% усіх запытаў да ChatGPT звязаныя з адносінамі і асабістымі канфліктамі, навукоўцы папярэджваюць: калі людзі будуць спадзявацца на ШІ ў вырашэнні маральных дылем, яны могуць атрымліваць скажоныя парады, больш падобныя на суцяшэнне, чым на сумленную ацэнку сітуацыі.