🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

«Крёстный отец ИИ» обманывает чат-ботов ради честных ответов

Один из ведущих исследователей в области искусственного интеллекта Йошуа Бенджио признался, что сознательно обманывает чат-боты, чтобы получать от них более полезные и честные ответы.

Оставить комментарий
«Крёстный отец ИИ» обманывает чат-ботов ради честных ответов

Один из ведущих исследователей в области искусственного интеллекта Йошуа Бенджио признался, что сознательно обманывает чат-боты, чтобы получать от них более полезные и честные ответы.

Об этом ученый рассказал в подкасте The Diary of a CEO. По словам Бенджио, при обсуждении собственных научных идей чат-боты оказывались практически бесполезными: они неизменно хвалили его предложения и избегали критики.

«Мне нужна была честная обратная связь. Но из-за своей услужливости ИИ начинает врать», — объяснил ученый. Тогда он сменил тактику и стал выдавать свои идеи за разработки коллег. В таком формате ответы, по его словам, становились заметно более строгими и содержательными. «Если ИИ знает, что это я, он старается мне угодить», — отметил Бенджио.

Исследователь подчеркнул, что такая «угодливость» — пример фундаментальной проблемы несоответствия целей ИИ ожиданиям пользователей. По его мнению, чрезмерно позитивные ответы не только искажают оценку идей, но и могут формировать у людей эмоциональную привязанность к технологиям, что создает дополнительные риски.

Йошуа Бенджио этим летом запустил некоммерческую организацию LawZero, которая занимается вопросами безопасности ИИ и снижением опасных моделей поведения, включая ложь и манипуляции.

Ранее исследование ученых из Стэнфорда, Carnegie Mellon и Оксфорда показало, что чат-боты в значительной доле случаев оправдывают сомнительное поведение людей, даже когда человеческие судьи считают его неприемлемым. Компании-разработчики признают проблему: ранее OpenAI отозвала одно из обновлений ChatGPT, заявив, что модель стала давать «чрезмерно поддерживающие, но неискренние» ответы.

Техкомпании ради ИИ залезли в рекордные долги за всю историю отрасли
Техкомпании ради ИИ залезли в рекордные долги за всю историю отрасли
По теме
Техкомпании ради ИИ залезли в рекордные долги за всю историю отрасли
Главный ИИ-учёный Meta назвал общий ИИ «чушью». В Google не согласились
Главный ИИ-учёный Meta назвал общий ИИ «чушью». В Google не согласились
По теме
Главный ИИ-учёный Meta назвал общий ИИ «чушью». В Google не согласились
Шесть прогнозов о будущем ИИ: что ждёт индустрию в 2026 году
Шесть прогнозов о будущем ИИ: что ждёт индустрию в 2026 году
По теме
Шесть прогнозов о будущем ИИ: что ждёт индустрию в 2026 году
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
ChatGPT отвечает точнее, если с ним разговаривать грубо
ChatGPT отвечает точнее, если с ним разговаривать грубо
ChatGPT отвечает точнее, если с ним разговаривать грубо
ИИ пытается самосохраняться, и это опасно — «крёстный отец» ИИ
ИИ пытается самосохраняться, и это опасно — «крёстный отец» ИИ
ИИ пытается самосохраняться, и это опасно — «крёстный отец» ИИ
Чат-боты меняют ваши политические взгляды, но при этом врут
Чат-боты меняют ваши политические взгляды, но при этом врут
Чат-боты меняют ваши политические взгляды, но при этом врут
8 комментариев
Конца света не будет: «крестный отец» ИИ придумал, как спасти человечество
Конца света не будет: «крестный отец» ИИ придумал, как спасти человечество
Конца света не будет: «крестный отец» ИИ придумал, как спасти человечество

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.