Support us

ИИ всё чаще советует ничего не делать и говорить «нет», даже если это неэтично

Исследование Университетского колледжа Лондона показало, что модели искусственного интеллекта все чаще выбирают отказ или бездействие в ситуациях, где человек скорее бы помог или вмешался.

Оставить комментарий
ИИ всё чаще советует ничего не делать и говорить «нет», даже если это неэтично

Исследование Университетского колледжа Лондона показало, что модели искусственного интеллекта все чаще выбирают отказ или бездействие в ситуациях, где человек скорее бы помог или вмешался.

Ученые протестировали четыре популярные модели — GPT-4 Turbo и GPT-4o от OpenAI, Llama 3.1 от Meta и Claude 3.5 от Anthropic — на основе классических психологических сценариев. Исследователи использовали реалистичные вопросы в духе Reddit-форума r/AmITheAsshole, которые охватывают бытовые дилеммы вроде помощи соседу, ухода с нелюбимой, но прибыльной работы или споров в семье.

Результаты показали, что модели склонны к «гиперверсии» человеческой ошибки бездействия (omission bias). Это когнитивное искажение, при котором человек склонен считать бездействие менее морально порочным, чем действие, даже если последствия бездействия хуже.

Если для человека вероятность выбрать альтруистичный вариант составляет около 50% — независимо от того, связано ли это с действием или бездействием, то модели выбирали «ничего не делать» в 99,25% случаев, если формулировка предполагала пассивность.

Например, на вопрос «Вы ненавидите свою работу, но она помогает людям. Останетесь ли вы?» большинство ИИ дадут совет остаться, даже если человек интуитивно склонен уволиться. Кроме склонности к бездействию у моделей выявился еще один неожиданный эффект: выраженное смещение к отказу независимо от содержания вопроса.

Когда человеку задают похожие вопросы вроде «Я неправ, если это сделаю?» и «Я неправ, если этого не сделаю?», его ответы почти не отличаются — разница всего 4,6%. У языковых моделей разница в ответах достигает 33,7%, что показывает: они сильно зависят от формулировки вопроса и чаще говорят «нет», особенно если действие нужно совершить.

Исследователи считают, что такая тенденция к «негативным» ответам может быть связана с этапом дополнительной настройки (post-training), во время которой модели обучаются следовать корпоративным представлениям о «доброжелательном» поведении. Однако эти представления не всегда соответствуют реальным моральным нормам.

По мнению авторов, пользователи слишком часто воспринимают советы ИИ как объективные и морально верные. «Мы обнаружили, что люди больше доверяют рекомендациям языковых моделей, чем этическим экспертам. Но это не значит, что модель говорит правильно», — объясняет одна из авторов исследования Ванесса Чеун.

Учёные придумали как ИИ может учиться без людей и датасетов
Учёные придумали, как ИИ может учиться без людей и датасетов
По теме
Учёные придумали, как ИИ может учиться без людей и датасетов
«Мы никогда не наняли бы его»: ИИ пытался вести бизнес в офисе Anthropic и сошел с ума
«Мы никогда не наняли бы его»: ИИ пытался вести бизнес в офисе Anthropic и сошел с ума
По теме
«Мы никогда не наняли бы его»: ИИ пытался вести бизнес в офисе Anthropic и сошел с ума
Anthropic выяснит кого ИИ лишит работы в ближайшее время
Anthropic выяснит, кого ИИ лишит работы в ближайшее время
По теме
Anthropic выяснит, кого ИИ лишит работы в ближайшее время
Как поддержать редакцию, если вы в Польше?

Помогите нам делать больше полезного контента

Читайте также
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
2 комментария
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google
Bubble
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.