Дапамажыце dev.by 🤍
Падтрымаць

Cloudflare абвінаваціла Perplexity у зборы дадзеных для ШІ у абход забарон, заблакавала ботаў

Cloudflare абвінаваціла Perplexity у масавым скрэйпінгу вэб-сайтаў, якія наўпрост забараняюць збор дадзеных. Паводле свежага даследавання воблачнай кампаніі, боты Perplexity ігнаруюць тэхнічныя абмежаванні, усталяваныя ў файле robots.txt, і працягваюць вымаць і капіяваць кантэнт з дзесяткаў тысяч даменаў, робячы мільёны запытаў штодня.

2 каментарыя

Cloudflare абвінаваціла Perplexity у масавым скрэйпінгу вэб-сайтаў, якія наўпрост забараняюць збор дадзеных. Паводле свежага даследавання воблачнай кампаніі, боты Perplexity ігнаруюць тэхнічныя абмежаванні, усталяваныя ў файле robots.txt, і працягваюць вымаць і капіяваць кантэнт з дзесяткаў тысяч даменаў, робячы мільёны запытаў штодня.

Cloudflare сцвярджае, што Perplexity змяняе назвы сваіх ботаў у полі User-Agent і выкарыстоўвае аўтаномныя сістэмы для абыходу блакіровак, напрыклад імітацыю браўзера Google Chrome на macOS. Кампанія выявіла гэта пасля скаргаў кліентаў, якія ўнеслі правілы ў robots.txt і ўсталявалі дадатковыя блакіроўкі для вядомых ботаў Perplexity. У выніку Cloudflare выключыла ботаў Perplexity са свайго афіцыйнага спіса давераных краўлераў і ўкараніла дадатковыя механізмы іх блакіроўкі.

У Perplexity назвалі пост Cloudflare маркетынгавым хадом і сказалі, што яе скрыншоты не пацвярджаюць факт доступу да кантэнту. Там дадалі, што згаданы ў справаздачы бот не належыць стартапу. Cloudflare настойвае на дакладнасці сваіх дадзеных.

Раней Cloudflare ўжо выступала з крытыкай агрэсіўнага скрэйпінгу з боку ШІ-кампаній, а кіраўнік Cloudflare Мэцью Прынс заяўляў, што масавы збор дадзеных падрывае эканоміку інтэрнэту, асабліва для навінавых выданняў. Кампанія выпусціла бясплатны інструмент для абароны ад капіявання кантэнту для навучання мадэляў і запусціла гандлёвую платформу, якая дазваляе ўладальнікам сайтаў браць плату з ШІ-распрацоўшчыкаў за доступ да дадзеных.

Гэта не першае абвінавачванне на адрас Perplexity. У мінулым годзе выданні, у тым ліку Wired, абвінавачвалі стартап ва ўзнаўленні іх матэрыялаў без належнага ўказання крыніцы.

Flo урэгулявала шматмільярдны 4-гадовы пазоў аб перадачы карыстальніцкіх дадзеных
Flo урэгулявала шматмільярдны 4-гадовы пазоў аб перадачы карыстальніцкіх дадзеных
Па тэме
Flo урэгулявала шматмільярдны 4-гадовы пазоў аб перадачы карыстальніцкіх дадзеных
Perplexity запусціў ШІ-браўзер
Perplexity запусціў ШІ-браўзер
Па тэме
Perplexity запусціў ШІ-браўзер
Чытайце таксама
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
2 каментарыя
Hyundai запустила институт искусственного интеллекта
Hyundai запустила институт искусственного интеллекта
Hyundai запустила институт искусственного интеллекта
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
1 каментарый
Технодайджест
Технодайджест
Технодайджест

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

0

Ну блин, надеюсь всё с ним будет нормально.
Только недавно открыл perplexity и то какой он удобный и классный. Сбор информации по интернету с ним раз в 5 быстрее гугла

Почему если ботам гугла можно собирать информацию то другим нет?

Карыстальнік адрэдагаваў каментарый 5 жніўня 2025, 16:05

m-yan
m-yan Аналитик в Компании
0

Гугл ограничивается через robots.txt