Дапамажыце dev.by 🤍
Падтрымаць

Cloudflare абвінаваціла Perplexity у зборы дадзеных для ШІ у абход забарон, заблакавала ботаў

Cloudflare абвінаваціла Perplexity у масавым скрэйпінгу вэб-сайтаў, якія наўпрост забараняюць збор дадзеных. Паводле свежага даследавання воблачнай кампаніі, боты Perplexity ігнаруюць тэхнічныя абмежаванні, усталяваныя ў файле robots.txt, і працягваюць вымаць і капіяваць кантэнт з дзесяткаў тысяч даменаў, робячы мільёны запытаў штодня.

2 каментарыя

Cloudflare абвінаваціла Perplexity у масавым скрэйпінгу вэб-сайтаў, якія наўпрост забараняюць збор дадзеных. Паводле свежага даследавання воблачнай кампаніі, боты Perplexity ігнаруюць тэхнічныя абмежаванні, усталяваныя ў файле robots.txt, і працягваюць вымаць і капіяваць кантэнт з дзесяткаў тысяч даменаў, робячы мільёны запытаў штодня.

Cloudflare сцвярджае, што Perplexity змяняе назвы сваіх ботаў у полі User-Agent і выкарыстоўвае аўтаномныя сістэмы для абыходу блакіровак, напрыклад імітацыю браўзера Google Chrome на macOS. Кампанія выявіла гэта пасля скаргаў кліентаў, якія ўнеслі правілы ў robots.txt і ўсталявалі дадатковыя блакіроўкі для вядомых ботаў Perplexity. У выніку Cloudflare выключыла ботаў Perplexity са свайго афіцыйнага спіса давераных краўлераў і ўкараніла дадатковыя механізмы іх блакіроўкі.

У Perplexity назвалі пост Cloudflare маркетынгавым хадом і сказалі, што яе скрыншоты не пацвярджаюць факт доступу да кантэнту. Там дадалі, што згаданы ў справаздачы бот не належыць стартапу. Cloudflare настойвае на дакладнасці сваіх дадзеных.

Раней Cloudflare ўжо выступала з крытыкай агрэсіўнага скрэйпінгу з боку ШІ-кампаній, а кіраўнік Cloudflare Мэцью Прынс заяўляў, што масавы збор дадзеных падрывае эканоміку інтэрнэту, асабліва для навінавых выданняў. Кампанія выпусціла бясплатны інструмент для абароны ад капіявання кантэнту для навучання мадэляў і запусціла гандлёвую платформу, якая дазваляе ўладальнікам сайтаў браць плату з ШІ-распрацоўшчыкаў за доступ да дадзеных.

Гэта не першае абвінавачванне на адрас Perplexity. У мінулым годзе выданні, у тым ліку Wired, абвінавачвалі стартап ва ўзнаўленні іх матэрыялаў без належнага ўказання крыніцы.

Flo урэгулявала шматмільярдны 4-гадовы пазоў аб перадачы карыстальніцкіх дадзеных
Flo урэгулявала шматмільярдны 4-гадовы пазоў аб перадачы карыстальніцкіх дадзеных
Па тэме
Flo урэгулявала шматмільярдны 4-гадовы пазоў аб перадачы карыстальніцкіх дадзеных
Perplexity запусціў ШІ-браўзер
Perplexity запусціў ШІ-браўзер
Па тэме
Perplexity запусціў ШІ-браўзер
Чытайце таксама
Былы кіраўнік Intel будуе «хрысціянскі ШІ», каб »наблізіць вяртанне Хрыста»
Былы кіраўнік Intel будуе «хрысціянскі ШІ», каб »наблізіць вяртанне Хрыста»
Былы кіраўнік Intel будуе «хрысціянскі ШІ», каб »наблізіць вяртанне Хрыста»
GitHub сабраў ШІ-агентаў OpenAI, Google і Anthropic у адным месцы
GitHub сабраў ШІ-агентаў OpenAI, Google і Anthropic у адным месцы
GitHub сабраў ШІ-агентаў OpenAI, Google і Anthropic у адным месцы
PayPal стане першым плацежным сэрвісам у ChatGPT
PayPal стане першым плацежным сэрвісам у ChatGPT
PayPal стане першым плацежным сэрвісам у ChatGPT
Amazon звольніла 14 000 супрацоўнікаў дзеля «эфектыўнасці і хуткасці»
Amazon звольніла 14 000 супрацоўнікаў дзеля «эфектыўнасці і хуткасці»
Amazon звольніла 14 000 супрацоўнікаў дзеля «эфектыўнасці і хуткасці»

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

0

Ну блин, надеюсь всё с ним будет нормально.
Только недавно открыл perplexity и то какой он удобный и классный. Сбор информации по интернету с ним раз в 5 быстрее гугла

Почему если ботам гугла можно собирать информацию то другим нет?

Карыстальнік адрэдагаваў каментарый 5 жніўня 2025, 16:05

m-yan
m-yan Аналитик в Компании
0

Гугл ограничивается через robots.txt