Больш за траціну новых сайтаў у інтэрнэце створана ШІ — і ён робіць вэб бадзёрым і аднастайным
Даследчыкі са Стэнфарда, Імперскага каледжа Лондана і «Архіва Інтэрнэту» высветлілі, што да сярэдзіны 2025 года каля 35% усіх новых сайтаў былі створаны з дапамогай ШІ або пры яго ўдзеле — супраць нуля да запуску ChatGPT у канцы 2022 года.
Даследчыкі са Стэнфарда, Імперскага каледжа Лондана і «Архіва Інтэрнэту» высветлілі, што да сярэдзіны 2025 года каля 35% усіх новых сайтаў былі створаны з дапамогай ШІ або пры яго ўдзеле — супраць нуля да запуску ChatGPT у канцы 2022 года.
Адпраўным пунктам для даследавання паслужыла «Тэорыя мёртвага інтэрнэту» — ідэя пра тое, што значную частку вэба сёння складае кантэнт, які генеруюць боты для іншых ботаў. Каманда вырашыла праверыць яе на рэальных дадзеных: для гэтага праз Wayback Machine былі атрыманы ўзоры сайтаў за 33 месяцы — з жніўня 2022 па май 2025 года. Для вызначэння ШІ-аўтарства выкарыстоўваўся дэтэктар Pangram v3, які паказаў найбольшую дакладнасць сярод пратэставаных інструментаў.
Даследчыкі праверылі шэсць распаўсюджаных апасенняў наконт ШІ-кантэнту: ці вядзе ён да звужэння спектра меркаванняў, распаўсюджвання дэзінфармацыі, «санітызацыі» тону, зніжэння сэнсавай шчыльнасці тэкстаў, знікнення ўнікальных аўтарскіх галасоў і дэградацыі спасылачнай культуры. Пацвердзіліся толькі два з шасці: ШІ сапраўды робіць інтэрнэт семантычна менш разнастайным і заўважна больш пазітыўным па тоне. Ні росту колькасці фактычных памылак, ні пагаршэння з цытаваннем крыніц даследчыкі не выявілі.
«Самым нечаканым аказалася тое, што не пацвердзілася гіпотэза пра дэградацыю праўдзівасці», — кажа даследчык ШІ са Стэнфарда і суаўтар працы Йонаш Далежал. Пры гэтым ён удакладняе, што гаворка ідзе пра верыфікаваную хлусню, якую правяралі жывыя фактчэкеры. Магчыма, ШІ проста павялічвае аб’ём сцвярджэнняў, якія ў прынцыпе нельга праверыць — або інтэрнэт ад пачатку не быў асабліва праўдзівым. Долежал называе «ўражваючай» хуткасць, з якой ШІ захапіў вэб: «Людзі будавалі інтэрнэт дзесяцігоддзямі, а значная яго частка стала вызначацца ШІ усяго за тры гады».
Каманда планіруе ператварыць даследаванне ў пастаянна працуючы інструмент маніторынгу сумесна з «Архівам інтэрнэту», а таксама дэталізаваць дадзеныя па катэгорыях сайтаў і мовах. Далежал бачыць у гэтым не толькі акадэмічную задачу: «Па меры распаўсюджвання ШІ-кантэнту выклік у тым, каб знайсці для гэтых мадэляў ролю, якая не зводзіцца да стварэння санітызаванага, аднастайнага вэба. Магчыма, мадэлям варта дазволіць мець больш выяўленую індывідуальнасць — тады яны змогуць стаць творчым партнёрам, а не заменай чалавечага голасу».
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.