Алеся Чапкевич world 10 верасня 2025, 13:37

OpenAI патлумачыла, чаму чат-боты галюцынуюць

OpenAI апублікавала даследаванне пра «галюцынацыі» ў вялікіх моўных мадэлях, на якіх будуюцца чат-боты, калі яны выдаюць прыдуманую інфармацыю за сапраўдную. Праблемы з фактамі ёсць нават у папулярных сэрвісаў, уключаючы GPT-5 і Claude.

3 каментарыя

OpenAI апублікавала даследаванне пра «галюцынацыі» ў вялікіх моўных мадэлях, на якіх будуюцца чат-боты, калі яны выдаюць прыдуманую інфармацыю за сапраўдную. Праблемы з фактамі ёсць нават у папулярных сэрвісаў, уключаючы GPT-5 і Claude.

Галоўная прычына ў тым, як навучаюць мадэлі і як уладкаваны бэнчмаркі. Мадэлям выгадней зрабіць няправільную здагадку, чым прызнаць, што яны не ведаюць адказ. Так яны з большай верагоднасцю атрымаюць узнагароду, да якой імкнуцца.

Адны мадэлі гуляюць у адгадванне лепш, чым іншыя. Раней OpenAI адзначала, што мадэлі Claude, напрыклад, у выпадку няўпэўненасці часцей спрабуюць не даваць недакладныя адказы, хоць гэта і абмяжоўвае карыснасць сэрвісу.

«Галюцынацыі распаўсюджаны з-за таго, як уладкаваны метады ацэнкі моўных мадэляў: іх натаскваюць добра здаваць тэсты. А адгадванне ў сітуацыі няпэўнасці толькі паляпшае вынік», — адзначаюць даследчыкі.

Па сутнасці, мадэлі заўсёды ў рэжыме экзамена. І калі людзі ў рэальным жыцці вучацца разумець, што часам лепш прызнаць няўпэўненасць, то мадэляў за няўпэўненасць караюць — для іх усё чорна-белае, правільнае ці няправільнае.

Вырашыць праблему даследчыкі прапануюць карэкціроўкай і уніфікацыяй тэстаў і метрык для ацэнкі мадэляў. Трэба выдаліць пакаранне за ўстрыманне ад адказу пры няўпэўненасці і практыкі, якія заахвочваюць адгадванне.

3 каментарыя

Тэкст: Алеся Чапкевич Крыніца: OpenAI Тэгі: openai, искусственный интеллект, модели, чатботы

Знайшлі памылку ў тэксце-вылучыце яе і націсніце Ctrl+Enter. Знайшлі памылку ў тэксце-вылучыце яе і націсніце кнопку «Паведаміць пра памылку».

Сайт компании Вакансии

Размяшчэнне рэкламы

Чат-боты згаджаюцца з памылкамі ў промптах, калі іх не папярэдзіць

OpenAI патлумачыла, чаму чат-боты галюцынуюць

3 каментарыя

OpenAI абнавіла ChatGPT: адказы больш дакладныя і менш крынжовыя

OpenAI палепшыла генерацыю карцінак: ШІ больш не блытаецца ў тэксце

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

gas

2

в OpenAI сознательно гонят не раскрывая того как устроены ИИ классификаторы - это классификаторы и никакого интеллекта там нет :)

https://www.youtube.com/watch?v=l-9ALe3U-Fg
https://www.youtube.com/watch?v=5eqRuVp65eY

https://www.youtube.com/@WelchLabsVideo/videos

Some Name

1

Они будут до последнего придумывать истории для хомячков, все просто - это способ получить инвестиции, т.е. перераспределить деньги. Конкретно те люди которые раздувают эту тему - профессиональные аферисты, цель вложить в такие стартапы на ранней стадии, потом выйти в прибыль на следующих раундах. Платят за это обычные люди по всему мирку которые откладывают деньги в пенсионные и другие фонды.
Эти цикли происходят каждые N лет. Сейчас рассказывают что еще немного и появится что-то называемое ИИ которое заменит человека - хотя понятно что текущая технология не является ИИ. До этого был бум блокчейна, все должно было быть на блокчейне. Еще была бигдата, которая должна была быть везде.
В общем это все очередные нанотехнологии. Найдена некоторая полезная функция, но аферисты пытаются убедить что там что-то глубже.
А еще есть всякие медиа, которые полезные новости найти не в состоянии и цель которых просмотры. По этому как только появляется очередная нанотехнология они пишут про это по несколько бессмысленных статей на день.

Alex V

0

это классификаторы

Ну, и что это объясняет? Почему классификаторы не могут быть интеллектом? Что вообще значит "классификатор" в контексте штуки, с которой можно разговаривать на любые темы? Если уж на то пошло, то классификация - разделение на группы, а трансформер продолжает цепочку токентов новыми токенами.

Войдите, чтобы оставить комментарий