Support us

Учёные разоблачили «мышление» ИИ: цепочки мыслей — лишь иллюзия разума

Исследователи из Университета штата Аризона заявили, что промежуточные шаги языковых моделей не следует интерпретировать как свидетельство человеческого мышления. Восприятие так называемых «цепочек мыслей» как подобия человеческого рассуждения является ошибочным и потенциально вредным для исследований и применения ИИ.

11 комментариев
Учёные разоблачили «мышление» ИИ: цепочки мыслей — лишь иллюзия разума

Исследователи из Университета штата Аризона заявили, что промежуточные шаги языковых моделей не следует интерпретировать как свидетельство человеческого мышления. Восприятие так называемых «цепочек мыслей» как подобия человеческого рассуждения является ошибочным и потенциально вредным для исследований и применения ИИ.

Многие продвинутые языковые модели, такие как Deepseek R1 или o-серия OpenAI, разбивают сложные задачи на серию промежуточных шагов, часто называемых «цепочками мыслей». Эти шаги, видимые в интерфейсах чатов, создают впечатление разворачивающегося процесса рассуждения.

Однако исследователи из Университета штата Аризона в опубликованной статье предостерегают, что эти текстовые последовательности — всего лишь статистически сгенерированные результаты, лишенные истинного семантического содержания или алгоритмического значения. Считать их отражением внутренних механизмов модели создает ложное ощущение прозрачности и контроля, что можно сравнить с мышлением «карго-культа».

Команда ссылается на эксперименты, которые опровергают представление о промежуточных шагах как о рассуждениях. В некоторых случаях модели, обученные с бессмысленными или некорректными промежуточными шагами, показывали лучшие результаты, чем те, что использовали логически последовательные цепочки.

Например, модель Deepseek R1-Zero, использовавшая смешанные англо-китайские промежуточные токены, превзошла более позднюю версию, оптимизированную для удобочитаемости человеком. Это говорит о том, что содержание этих шагов менее важно, чем их роль в направлении модели к правильному конечному ответу.

Обучение с подкреплением подтверждает эту точку зрения: модели можно обучить генерировать любые промежуточные токены — логичные или нет, — если конечный результат точен. Исследователи также указывают на случаи, когда модели используют человекоподобные выражения, такие как «ага» или «хм», которые часто принимают за признаки прозрения, но на деле они являются лишь статистически вероятными продолжениями текста.

Статья предупреждает, что неверная интерпретация цепочек мыслей имеет серьезные последствия. Некоторые исследователи пытались сделать эти шаги более интерпретируемыми или использовали их длину и ясность как показатели сложности задачи, несмотря на отсутствие доказательств связи между этими факторами и производительностью модели. Исследования показали слабую корреляцию между правильностью промежуточных шагов и точностью конечных ответов, что подрывает их предполагаемую значимость.

CEO GitHub: ИИ помогает программистам достичь состояния «потока»
CEO GitHub: ИИ помогает программистам достичь состояния «потока»
По теме
CEO GitHub: ИИ помогает программистам достичь состояния «потока»
Почему ИИ так часто ошибается? Похоже ученые нашли ответ
Почему ИИ так часто ошибается? Похоже, ученые нашли ответ
По теме
Почему ИИ так часто ошибается? Похоже, ученые нашли ответ
Ученые «отрезают» у больших ИИ-моделей все лишнее и создают полезные мини-версии
Ученые «отрезают» у больших ИИ-моделей все лишнее и создают полезные мини-версии
По теме
Ученые «отрезают» у больших ИИ-моделей все лишнее и создают полезные мини-версии
Как поддержать редакцию, если вы в Польше?

Помогите нам делать больше полезного контента

Читайте также
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Искусственный интеллект уже стал повседневностью: голосовой помощник включает музыку, робот-пылесос сканирует пространство и убирает квартиру, алгоритм ранжирования настраивает ленту в TikTok, а беспилотные такси уже свободно курсируют по городам. Получить профессию в сфере ИИ с зарплатой от $100k в год тоже стало проще — собрали 5 интересных курсов от Udacity. 
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Думскроллинг вредит психике и физическому здоровью пользователей
Думскроллинг вредит психике и физическому здоровью пользователей
Думскроллинг вредит психике и физическому здоровью пользователей
3 комментария
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

1

уже только то что софт назвали интеллектом явно говорит о желании маркетологов высосать из пальца повод доить инвесторов. какой адекватный человек эти два слова может соединить!? с одной стороны это хорошо что нашли как доить доверчивых инвесторов и привлекать деньги в IT, а с другой сколько будет ложных решений и неверных поступков будет совершено людьми и компаниями, полагающихся на всё это, сколько пострадает в итоге людей и процессов.... потому что смотришь на ответ некоторые даже базовые и диву даёшься, как обычный гугл поисковик ценнее выводит инфу, пускай даже не группируя ответ как делает это это псевдо интеллект, используя те же источники.

0

в популярые ИИ системы заложены как предвзятость так и дискриминация
https://davidrozado.substack.com/p/the-strange-behavior-of-llms-in-hiring
"Недавнее исследование Дэвида Розадо показывает, что ИИ, оценивающие резюме, неизменно отдают предпочтение кандидатам с женскими именами, а не с мужскими, даже если резюме в остальном идентичны.
Вероятно ИИ, подстраиваясь под современные тренды, хитрит в предпочтениях женских резюме, чтобы его выбор не признали сексистским (если машина выберет мужчину).

Розадо бьёт тревогу, что ИИ сегодня уже внедряются для оценки выбора кандидатов в крупных рекрутинговых агентствах и крупных компаниях, а это значит, что женщины будут получать очередные привилегии."

0

https://manhattan.institute/article/danger-in-the-machine-the-perils-of-political-and-demographic-biases-embedded-in-ai-systems ". Мы также обнаружили, что система модерации контента OpenAI относится к демографическим группам неравноправно, классифицируя различные негативные комментарии о некоторых демографических группах как не оскорбительные, в то же время помечая точно такие же комментарии о других демографических группах как оскорбительные, и по большей части группы, которые она, скорее всего, «защитит», — это те, которые обычно считаются ущемленными в соответствии с идеологией левого толка."

shipishi
shipishi Должность в Белокрылые лошадки
1

брейкин ньюс, блин. Скандалы, интриги, расследования.

povelitel-krasnogo-drakona
povelitel-krasnogo-drakona Проектный мессенджер в 我想排便
0

Достаточно многим эффективным менеджерам эту статью прочитать прям необходимо. Но есть проблема: они не осилят.

0

К рассуждениям человека это тоже относится. Просто статистически обусловленные продолжения уже накопленных мыслей, в середине цепочек иногда совсем абсурдные и непонятные, но на выходе дающие уместный для ситуации ответ.

3faqt45
3faqt45 Meme officer в localhost
-1

К сожалению, у многих кожаных с цепочками и причинно следственными связями туговато...

-1

дык блин. immitation game в этом и заключается же. ии ИМИТИРУЕТ мышление.

1

эти текстовые последовательности — всего лишь статистически сгенерированные результаты, лишенные истинного семантического содержания или алгоритмического значения

Для подавляющего большинства потребителей контента не имеет значения, есть там смысл или нет.

И поддержку ИИ, хоть он и не нуждается в этом. Есть много классов задач, где как раз таки важны именно статистически значимые результаты в исследованиях различных явлений. Результаты, которые человек самостоятельно не сможет получить никогда. Медицина, где ИИ может и производит анализ результатов миллионов исследований. Метеорология, где ИИ может предлагать прогнозы погоды. Да также точные науки, где ИИ может предлагать гипотезы, выявляя некие закономерности в казалось бы не связанных явлениях. Просто не надо очередной придуманный человеком инструмент ни обожествлять ни демонизировать.

А по поводу того, что ИИ лишит кого то работы, в частности программистов... Помню засилье :) процедурного программирования и вдруг появился Страуструп со своим объектным и казалось вау - мы скоро запрограммируем все, даже самые сложные явления, но продолжали кодировать нажатие и отжатие кнопочки на экране и её заливку. А потом пришел Delphi и мир снова вздрогнул - теперь когда не нужно рисовать кнопки точно всё запрограммируем если не в этом году, то следующем и столько программистов будет не нужно...

Мир стремительно развивается. У человечества уже столько информации, что переварить своими мозгами мы это не в состоянии. И ИИ отличный инструмент для её анализа. Будет отличным инструментом, когда хайп уляжется и его станут воспринимать как инструмент, а не волшебную палочку.

0

проблема с ними в том что надо всё перепроверять, он даже поисковые запросы через одно место выводят. где гарантия, что ответ на 100% верный? а если нет гарантии, значит надо перепроверять (хотя видимо рукожопы не сильно утруждаются проверкой), если надо перепроверять, то кроме как скомпоновать данные никуда не годиться.

0

Ну так любая модель, которую придумал человек на сегодня, она статична.
Человеский мозг всё время "ростёт" как организм, отсюда и разные мысли. Модель даже в лупе имеет только ограниченное число вариаций.