Почему не стоит оставлять чат-бот в режиме по умолчанию
ИИ-инструменты в стандартном быстром режиме могут делать вид, что анализируют данные, но на деле подставлять ошибочные стереотипные выводы. Режимы рассуждения справляются с анализом лучше, но большинство пользователей оставляют настройки по умолчанию.
ИИ-инструменты в стандартном быстром режиме могут делать вид, что анализируют данные, но на деле подставлять ошибочные стереотипные выводы. Режимы рассуждения справляются с анализом лучше, но большинство пользователей оставляют настройки по умолчанию.
Математик Адам Кухарски создал тестовый набор данных: 2000 свободных текстовых ответов о том, какие эмоции испытывали респонденты, он пометил как ответы из Великобритании. ЗЗатем он взял тот же самый набор ответов, скопировал его и пометил уже как данные из США. После этого Кухарски объединил две части и перемешал строки. Иными словами, ответы «британцев» и «американцев» были полностью одинаковыми — отличались только подписи стран.
После этого он попросил Copilot в стандартном режиме Auto найти различия между двумя странами. Инструмент выдал подробный анализ и заявил, что ответы из США и Великобритании якобы отличаются «тоном, интенсивностью и стилем формулировок», хотя на самом деле наборы были идентичными.
Во втором тесте Кухарски усложнил задачу. Он сгенерировал 200 высказываний о карьерных целях, а затем пять раз скопировал один и тот же набор, пометив его как данные из США, Великобритании, Франции, Германии и Италии. Copilot снова нашел различия там, где их не было. Например, он сообщил, что итальянцы якобы в три раза чаще британцев интересуются карьерой в искусстве, а американцы в 1,5 раза сильнее ориентированы на бизнес, чем французы.
Когда ученый попросил инструмент проверить выводы глубже, Copilot сначала сделал простой подсчет по ключевым словам и получил одинаковые результаты для всех стран. Но затем проигнорировал собственную проверку и снова выдал количественный анализ с вымышленными различиями и процентами.
По мнению исследователя, проблема связана с режимом Auto. В нем Copilot должен сам выбирать подходящую модель для задачи, но в этом случае инструмент фактически не проанализировал данные, а оперся на культурные клише, уже заложенные в языковую модель. «Есть реальный риск, что люди сейчас используют ИИ для анализа, который не имеет никакого отношения к тому, что люди на самом деле сказали», — заявил ученый.
Журналист The Decoder Маттиас Бастиан повторил похожий эксперимент с Microsoft Copilot и Gemini Flash 3.5. Быстрые модели также начали описывать стереотипные различия между странами, хотя данные были одинаковыми. Более сильные модели с режимом рассуждения справились лучше: они написали код для проверки данных и заметили, что ответы дублируются.
Кухарски считает, что при анализе таблиц, опросов и текстовых данных не стоит полагаться на настройки по умолчанию. Быстрый режим может быть удобен для простых запросов, но в аналитических задачах он способен уверенно выдать не реальные выводы, а правдоподобные стереотипы.
При этом даже режим рассуждения не гарантирует идеального результата. В реальных условиях группы данных редко бывают полностью одинаковыми: ответы могут быть похожими, но не идентичными. В таких случаях модель все равно может достраивать выводы на основе предположений. Поэтому Кухарски советует заранее формулировать ожидаемый результат, проводить простые проверки и не доверять ИИ-анализу без верификации.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.