Support us

Почему не стоит оставлять чат-бот в режиме по умолчанию

ИИ-инструменты в стандартном быстром режиме могут делать вид, что анализируют данные, но на деле подставлять ошибочные стереотипные выводы. Режимы рассуждения справляются с анализом лучше, но большинство пользователей оставляют настройки по умолчанию.

Оставить комментарий
Почему не стоит оставлять чат-бот в режиме по умолчанию

ИИ-инструменты в стандартном быстром режиме могут делать вид, что анализируют данные, но на деле подставлять ошибочные стереотипные выводы. Режимы рассуждения справляются с анализом лучше, но большинство пользователей оставляют настройки по умолчанию.

Математик Адам Кухарски создал тестовый набор данных: 2000 свободных текстовых ответов о том, какие эмоции испытывали респонденты, он пометил как ответы из Великобритании. ЗЗатем он взял тот же самый набор ответов, скопировал его и пометил уже как данные из США. После этого Кухарски объединил две части и перемешал строки. Иными словами, ответы «британцев» и «американцев» были полностью одинаковыми — отличались только подписи стран.

После этого он попросил Copilot в стандартном режиме Auto найти различия между двумя странами. Инструмент выдал подробный анализ и заявил, что ответы из США и Великобритании якобы отличаются «тоном, интенсивностью и стилем формулировок», хотя на самом деле наборы были идентичными.

Во втором тесте Кухарски усложнил задачу. Он сгенерировал 200 высказываний о карьерных целях, а затем пять раз скопировал один и тот же набор, пометив его как данные из США, Великобритании, Франции, Германии и Италии. Copilot снова нашел различия там, где их не было. Например, он сообщил, что итальянцы якобы в три раза чаще британцев интересуются карьерой в искусстве, а американцы в 1,5 раза сильнее ориентированы на бизнес, чем французы.

Когда ученый попросил инструмент проверить выводы глубже, Copilot сначала сделал простой подсчет по ключевым словам и получил одинаковые результаты для всех стран. Но затем проигнорировал собственную проверку и снова выдал количественный анализ с вымышленными различиями и процентами.

По мнению исследователя, проблема связана с режимом Auto. В нем Copilot должен сам выбирать подходящую модель для задачи, но в этом случае инструмент фактически не проанализировал данные, а оперся на культурные клише, уже заложенные в языковую модель. «Есть реальный риск, что люди сейчас используют ИИ для анализа, который не имеет никакого отношения к тому, что люди на самом деле сказали», — заявил ученый.

Журналист The Decoder Маттиас Бастиан повторил похожий эксперимент с Microsoft Copilot и Gemini Flash 3.5. Быстрые модели также начали описывать стереотипные различия между странами, хотя данные были одинаковыми. Более сильные модели с режимом рассуждения справились лучше: они написали код для проверки данных и заметили, что ответы дублируются.

Кухарски считает, что при анализе таблиц, опросов и текстовых данных не стоит полагаться на настройки по умолчанию. Быстрый режим может быть удобен для простых запросов, но в аналитических задачах он способен уверенно выдать не реальные выводы, а правдоподобные стереотипы.

При этом даже режим рассуждения не гарантирует идеального результата. В реальных условиях группы данных редко бывают полностью одинаковыми: ответы могут быть похожими, но не идентичными. В таких случаях модель все равно может достраивать выводы на основе предположений. Поэтому Кухарски советует заранее формулировать ожидаемый результат, проводить простые проверки и не доверять ИИ-анализу без верификации.

«Это циркулярная пила»: стартапы выбрали лучший ИИ для кодинга. Вот какой
«Это циркулярная пила»: стартапы выбрали лучший ИИ для кодинга. Вот какой
По теме
«Это циркулярная пила»: стартапы выбрали лучший ИИ для кодинга. Вот какой
ИИ помогает писать больше кода но компании не успевают его проверять — сбои растут
ИИ помогает писать больше кода, но компании не успевают его проверять — сбои растут
По теме
ИИ помогает писать больше кода, но компании не успевают его проверять — сбои растут
Почему ИИ на работе так часто ошибается? Есть простое объяснение
Почему ИИ на работе так часто ошибается? Есть простое объяснение
По теме
Почему ИИ на работе так часто ошибается? Есть простое объяснение
Читайте также
Как сделать ответы ИИ умнее и полезнее — советы эксперта
Как сделать ответы ИИ умнее и полезнее — советы эксперта
Как сделать ответы ИИ умнее и полезнее — советы эксперта
OpenAI объяснила, почему чат-боты галлюцинируют
OpenAI объяснила, почему чат-боты галлюцинируют
OpenAI объяснила, почему чат-боты галлюцинируют
3 комментария
ИИ делает серьёзные ошибки в новостях в половине случаев
ИИ делает серьёзные ошибки в новостях в половине случаев
ИИ делает серьёзные ошибки в новостях в половине случаев
1 комментарий
Как чат-боты подталкивают к неверным решениям — исследование
Как чат-боты подталкивают к неверным решениям — исследование
Как чат-боты подталкивают к неверным решениям — исследование

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.