Живете в Польше? Поддержите devby 1,5% налога: бесплатно и за 5 минут 🤗
Support us

ИИ-боты разоряют «Википедию» из-за критического роста трафика

«Википедия» была вынуждена резко увеличить расходы на инфраструктуру из-за ботов искусственного интеллекта, которые активно копируют ее контент для обучения своих моделей. Этот неконтролируемый автоматизированный трафик многократно увеличивает нагрузку на сайт и приводит к росту затрат.

2 комментария
ИИ-боты разоряют «Википедию» из-за критического роста трафика

«Википедия» была вынуждена резко увеличить расходы на инфраструктуру из-за ботов искусственного интеллекта, которые активно копируют ее контент для обучения своих моделей. Этот неконтролируемый автоматизированный трафик многократно увеличивает нагрузку на сайт и приводит к росту затрат.

Фонд Wikimedia заявил о «геометрическом росте автоматизированных запросов на контент». По данным фонда, начиная с января 2024 года, пропускная способность, используемая для загрузки мультимедийного контента, возросла на 50%. При этом отмечается, что данный трафик генерируется не людьми, а автоматизированными программами (ботами-скрейперами), которые непрерывно загружают изображения и другие файлы с открытой лицензией для нужд обучения моделей ИИ.

В «Википедии» подчеркивают, что их инфраструктура рассчитана на внезапные всплески трафика от пользователей во время событий, вызывающих высокий интерес, таких как смерть известной личности. Однако объем трафика, генерируемого ботами-скрейперами, является беспрецедентным и представляет собой растущие риски и расходы.

В качестве примера приводится случай со смертью Джимми Картера в декабре 2024 года, когда его страница на английской «Википедии» вызвала значительный, но управляемый рост просмотров. Одновременное воспроизведение видео с его дебатов привело к временному удвоению сетевого трафика, что вызвало кратковременные задержки в загрузке страниц. Однако текущий рост базовой нагрузки из-за ботов значительно превышает подобные единичные всплески.

Специалисты «Википедии» утверждают, что по крайней мере 65% наиболее ресурсозатратного трафика приходится на ботов, при этом общее количество просмотров страниц ботами составляет лишь около 35%. Это объясняется тем, что редко запрашиваемые страницы хранятся в основном центре обработки данных, доступ к которому обходится дороже* Таким образом, запросы ботов чаще направляются в этот основной центр, что увеличивает расходы.

Платформа была вынуждена ввести индивидуальные ограничения скорости для ИИ-ботов или вообще запретить доступ некоторым из них. Однако в долгосрочной перспективе фонд разрабатывает план «Ответственного использования инфраструктуры». Этот план предусматривает сбор отзывов от сообщества «Википедии» о способах определения трафика от ИИ-ботов и фильтрации их доступа. Цель состоит в том, чтобы найти устойчивые способы для разработчиков и повторных пользователей получать доступ к знаниям, не ставя под угрозу работу и доступность «Википедии» для обычных пользователей.

ИИ сделает вашу компанию сильнее — если не убьeт раньше
ИИ сделает вашу компанию сильнее — если не убьет раньше
По теме
ИИ сделает вашу компанию сильнее — если не убьет раньше
Гейтс: если бы я мог вернуться назад сразу бы сделал Microsoft ИИ-компанией
Гейтс: если бы я мог вернуться назад, сразу бы сделал Microsoft ИИ-компанией
По теме
Гейтс: если бы я мог вернуться назад, сразу бы сделал Microsoft ИИ-компанией
Google открыла свою самую продвинутую ИИ-модель для всех пользователей
Google открыла свою самую продвинутую ИИ-модель для всех пользователей
По теме
Google открыла свою самую продвинутую ИИ-модель для всех пользователей
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Индийские ИТ-компании потеряли $50 млрд из-за ИИ с начала февраля — худший результата почти за год
Индийские ИТ-компании потеряли $50 млрд из-за ИИ с начала февраля — худший результата почти за год
Индийские ИТ-компании потеряли $50 млрд из-за ИИ с начала февраля — худший результата почти за год
В сети вирусится кампания QuitGPT — бойкот ChatGPT
В сети вирусится кампания QuitGPT — бойкот ChatGPT
В сети вирусится кампания QuitGPT — бойкот ChatGPT
Из 300 сотрудников осталось 40. ИТ-предприниматель рассказывает, как LLM расставляют всё по своим местам
Из 300 сотрудников осталось 40. ИТ-предприниматель рассказывает, как LLM расставляют всё по своим местам
Из 300 сотрудников осталось 40. ИТ-предприниматель рассказывает, как LLM расставляют всё по своим местам
Работаете в ИТ и думаете, что через 5 лет у вас будет работа? Увы, но скорее всего нет. Эра величия программистов заканчивается, поэтому готовьтесь или адаптироваться, или менять работу.  Ведь десятилетие ничем не обоснованного роста зарплат и плюшек разработчикам закончилось. 
7 комментариев
ИИ-агент пристыдил разраба за то, что тот отклонил его код
ИИ-агент пристыдил разраба за то, что тот отклонил его код
ИИ-агент пристыдил разраба за то, что тот отклонил его код

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

bacek
bacek Programmer в Конь с горы
1

Надо с ботов плату брать

Anonymous
Anonymous
0

Также как и open source проекты. Паразитический трафик ИИ ботов приостанавливает их разработку и даже блокирует.

Пользователь отредактировал комментарий 4 апреля 2025, 09:38