Reddit подал в суд на Perplexity: «контент хотят, а платить не хотят»
Reddit подал в суд на Perplexity и три сервиса по сбору данных — SerpApi, Oxylabs и AWMProxy, пишет The Verge. Их обвиняют в «незаконном обходе защиты данных в промышленных масштабах» и в том, что они ни перед чем не остановятся, чтобы прибрать к рукам бесценный контент платформы.
В Reddit говорят, что эти компании ведут себя как «грабители банков», которые, «понимая, что не могут вскрыть сейф, ломают бронированный грузовик с наличкой».
Reddit утверждает, что Perplexity является клиентом по крайней мере одного из этих сервисов и «готова на всё, чтобы заполучить данные Reddit, в которых отчаянно нуждается для своего поискового движка — кроме соглашения с нами, как это сделали некоторые конкуренты».
Согласно иску, в мае 2024 года Reddit отправил Perplexity письмо с требованием прекратить сбор данных. Та заверила, что не использует контент Reddit для обучения моделей и соблюдает правила для краулеров. Но вскоре после этого количество ссылок на Reddit в результатах Perplexity выросло.
Чтобы проверить подозрения, Reddit опубликовал пост, который мог видеть только Google. Компания утверждает, что через несколько часов его содержимое всплыло в Perplexity. Reddit делает вывод, что Perplexity «напрямую или через посредников собирает результаты поиска Google с контентом Reddit, а затем быстро использует эти данные».
Главный юрист Reddit Бен Ли считает ситуацию симптомом более широкой проблемы: «ИИ-компании ведут гонку за качественным человеческим контентом — и это подпитывает индустрию „отмывания данных“. Веб-скрейперы обходят защиту, крадут данные и перепродают их тем, кто ищет материал для обучения. Reddit — идеальная цель, ведь это одна из самых больших и живых коллекций человеческих бесед».
Он назвал Oxylabs, AWMProxy и SerpApi классическими примерами нарушителей: «Не имея возможности напрямую собирать контент с Reddit, они скрывают свою личность и местоположение, маскируют скрейперы и воруют контент из поиска Google. А Perplexity сознательно покупает эти данные, вместо того чтобы заключить с нами законное соглашение».
В Perplexity заявили, что пока не получили иск, но готовы «решительно отстаивать право пользователей на свободный и честный доступ к публичной информации». «Наш подход остаётся ответственным и принципиальным — мы предоставляем точные ответы с помощью надёжного ИИ и не потерпим угроз открытости и общественным интересам», — сказал глава по коммуникации Perplexity Джесс Дуайер в комментарии The Verge.
Читать на dev.by