Twitter запретил сканирование и парсинг соцсети для обучения ИИ
Х (экс-Twitter) обновил правила пользования — теперь никому нельзя сканировать и парсить соцсеть. Судя по всему, так Маск хочет не допустить использование контента Х сторонними разработчиками для обучения ИИ-моделей, пишет TechCrunch.
Новые правила вступают в силу 29 сентября. В них говорится, что для сканирования и парсинга платформы любыми способами и для любых целей необходимо предварительно получить письменное разрешение Х. Прежняя версия правил допускала сканирование в соответствии с файлом robots.txt, который содержит инструкции для поисковых роботов о том, какие части сайта им можно посещать. Но парсинг без спроса был запрещён.
Кроме того, в последние месяцы этот файл претерпел изменения — из него убрали инструкции для всех роботов-сканеров, кроме Google. В 2015 году Twitter заключил соглашение с Google о показе твитов в результатах поиска. Сохранились ли характер и условия этой сделки после смены руководства соцсети, неясно. Согласно обновленному файлу robots.txt, ботам запрещено собирать информацию о лайках и ретвитах конкретных постов, а также просматривать число лайков, медиафайлы и фотографии аккаунтов.
В июне соцсеть запретила просматривать размещённый контент неавторизованным пользователям. Мера продержалась всего несколько дней. Аргументировали её тогда борьбой с ботами-сборщиками данных, которые ухудшали качество работы площадки для обычных пользователей.
В апреле Маск угрожал судом Microsoft за неправомерный сбор данных X для тренировки ИИ-моделей. А в июле подал такой иск против четырёх неизвестных ответчиков.
Помимо этого, в новой пользовательской политике Х разрешил себе собирать биометрию юзеров, данные об их трудоустройстве и не только.
Читать на dev.by