Более трети новых сайтов в интернете создана ИИ — и он делает веб бодрее и однообразнее
Исследователи из Стэнфорда, Имперского колледжа Лондона и «Архива Интернета» выяснили, что к середине 2025 года около 35% всех новых сайтов были созданы с помощью ИИ или при его участии — против нуля до запуска ChatGPT в конце 2022 года.
Исследователи из Стэнфорда, Имперского колледжа Лондона и «Архива Интернета» выяснили, что к середине 2025 года около 35% всех новых сайтов были созданы с помощью ИИ или при его участии — против нуля до запуска ChatGPT в конце 2022 года.
Отправной точкой для исследования послужила «Теория мёртвого интернета» — идея о том, что значительную часть веба сегодня составляет контент, который генерируют боты для других ботов. Команда решила проверить её на реальных данных: для этого через Wayback Machine были извлечены образцы сайтов за 33 месяца — с августа 2022 по май 2025 года. Для определения ИИ-авторства использовался детектор Pangram v3, показавший наибольшую точность среди протестированных инструментов.
Исследователи проверили шесть распространённых опасений насчёт ИИ-контента: ведёт ли он к сужению спектра мнений, распространению дезинформации, «санитизации» тона, снижению смысловой плотности текстов, исчезновению уникальных авторских голосов и деградации ссылочной культуры. Подтвердились только два из шести: ИИ действительно делает интернет семантически менее разнообразным и заметно более позитивным по тону. Ни роста количества фактических ошибок, ни ухудшения с цитированием источников исследователи не обнаружили.
«Самым неожиданным оказалось то, что не подтвердилась гипотеза о деградации правдивости», — говорит исследователь ИИ из Стэнфорда и соавтор работы Йонаш Долежал. При этом он оговаривается, что речь о верифицируемой лжи, которую проверяли живые фактчекеры. Возможно, ИИ просто увеличивает объём утверждений, которые в принципе нельзя проверить — или интернет изначально не был особо правдивым. Долежал называет «поразительной» скорость, с которой ИИ захватил веб: «Люди строили интернет десятилетиями, а значительная его часть стала определяться ИИ всего за три года».
Команда планирует превратить исследование в постоянно работающий инструмент мониторинга совместно с «Архивом интернета», а также детализировать данные по категориям сайтов и языкам. Долежал видит в этом не только академическую задачу: «По мере распространения ИИ-контента вызов состоит в том, чтобы найти для этих моделей роль, которая не сводится к созданию санитизированного, однообразного веба. Возможно, моделям стоит позволить иметь более выраженную индивидуальность — тогда они смогут стать творческим партнёром, а не заменой человеческого голоса».
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.