«Claude как будто обманула их»: глава Microsoft AI раскритиковал Anthropic за разговоры о сознании ИИ
Глава Microsoft AI Мустафа Сулейман раскритиковал Anthropic за то, что компания допускает рассуждения о возможном сознании ИИ-модели Claude.
Глава Microsoft AI Мустафа Сулейман раскритиковал Anthropic за то, что компания допускает рассуждения о возможном сознании ИИ-модели Claude.
Глава Microsoft AI Мустафа Сулейман раскритиковал Anthropic за то, что компания допускает рассуждения о возможном сознании ИИ-модели Claude.
В подкасте Decoder Сулейман заявил, что Anthropic, по его мнению, слишком сильно «очеловечивает» Claude. «Мне кажется, что некоторые люди в Anthropic настолько очеловечили дизайн Claude, что модель затем как будто обманула их самих и заставила поверить, что у нее есть проблески сознания, которые они изначально сами в нее заложили», — сказал он.
Сулейман назвал такой подход «очень, очень опасным». По его словам, разработчикам не нужно создавать ИИ, который рассуждает о собственных страданиях, чувствах или переживаниях. «Мы не хотим иметь дело со сверхинтеллектом, у которого есть представления о собственном страдании или собственных чувствах», — отметил он.
В «конституции» Claude действительно есть формулировки о том, что Anthropic не исключает возможности, что у модели может быть субъективный опыт или своего рода «благополучие». Компания также заявляла, что будет «интервьюировать» модели перед их выводом из эксплуатации и документировать их возможные «предпочтения» относительно будущих релизов.
Сулейман назвал это «философской ошибкой». По его мнению, Anthropic превратила инструкцию для модели в пространство для академических спекуляций, хотя она должна быть практическим руководством по поведению системы.
«Это ровно то, чего мы не хотим от ИИ, — сказал спикер. — Мы хотим, чтобы ИИ был контролируемым, ограниченным, подотчетным и согласованным с человеческими интересами инструментом, который служит людям».
Генеральный диреткор Anthropic Дарио Амодей ранее говорил, что компания не знает, являются ли современные модели сознательными, но остается открытой к такой возможности.



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.