Дапамажыце dev.by 🤍
Падтрымаць

GPT-4 з часам «тупее», і ніхто не ведае, чаму

Карыстальнікі заўважылі, што з часам мадэль «пад капотам» ChatGPT працуе ўсё горш. Магчыма, ім не здалося: на гэтым тыдні выйшла сумеснае даследаванне навукоўцаў са Стэнфарда і Каліфарнійскага ўніверсітэта ў Берклі, якія параўналі якасць адказаў чатбота на базе GPT-4 і яе папярэдніцы GPT-3.5. Розніца выявілася каласальнай, і не на карысць найноўшай «мультымадальнай» мадэлі, якая акрамя тэкставага ўводу падтрымлівае карцінкі.

1 каментарый

Карыстальнікі заўважылі, што з часам мадэль «пад капотам» ChatGPT працуе ўсё горш. Магчыма, ім не здалося: на гэтым тыдні выйшла сумеснае даследаванне навукоўцаў са Стэнфарда і Каліфарнійскага ўніверсітэта ў Берклі, якія параўналі якасць адказаў чатбота на базе GPT-4 і яе папярэдніцы GPT-3.5. Розніца выявілася каласальнай, і не на карысць найноўшай «мультымадальнай» мадэлі, якая акрамя тэкставага ўводу падтрымлівае карцінкі.

Прычым у дрэнны бок адрозніваецца не толькі прадукцыйнасць, але і ў цэлым GPT-4 (дарэчы, даступная па падпісцы за грошы) з часам паказвае ўсё горшыя вынікі на тэставых заданнях. Сярод іх — матэматычныя задачы, пытанні на далікатныя тэмы, напісанне кода і заданні на апрацоўку выяў. Дакладнасць GPT-4 скацілася ад 97,6% у сакавіку да 2,4% у чэрвені. Таксама мадэль стала дапускаць больш памылак пры праграмаванні і менш ахвотна адказваць на далікатныя пытанні.

Аднак чаму гэта адбылося, аўтары працы не тлумачаць. Таксама яны сумняваюцца, што пра дэградацыю сваёй мадэлі ведаюць распрацоўшчыкі з OpenAI, і ў іх здольнасці адсочваць змены, каб прадухіліць негатыўную тэндэнцыю. Паводле назіранняў карыстальнікаў, мадэль стала генераваць адказы хутчэй, але іх якасць зніжаецца — яны спісваюць гэта на тое, што OpenAI спрабуе скарачаць выдаткі. Абмяркоўваць праблему на форуме кампаніі пачалі яшчэ ў маі. На думку некаторых экспертаў, прычына палягае ў «карэннай перапрацоўцы» мадэлі, але ў OpenAI гэта абверглі і — прынамсі на мінулым тыдні — сказалі, што наадварот імкнуцца зрабіць кожную новую версію разумнейшай за папярэднюю.

Пітч-прэзентацыі GPT-4 у тры разы часцей прыцягваюць інвестыцыі ніж «чалавечыя»
Пітч-прэзентацыі GPT-4 у тры разы часцей прыцягваюць інвестыцыі, ніж «чалавечыя»
Па тэме
Пітч-прэзентацыі GPT-4 у тры разы часцей прыцягваюць інвестыцыі, ніж «чалавечыя»
Стартапы пачалі выкарыстоўваць GPT-4 каб эканоміць на кодарах
Стартапы пачалі выкарыстоўваць GPT-4, каб эканоміць на кодарах
Па тэме
Стартапы пачалі выкарыстоўваць GPT-4, каб эканоміць на кодарах

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Anonymous
Anonymous
0

Есть мнение что когда сетку пытаются учить новому в объёмах, которые превышают её capacity это приводит к "размыванию" ранее обученного.