Support us

OpenAI и Anthropic собирают данные с сайтов несмотря на запреты

Ведущие ИИ-стартапы игнорируют настройки медийных сайтов, которые призваны не допустить бесплатный сбор их контента для тренировки моделей, узнал Business Insider.

Оставить комментарий
OpenAI и Anthropic собирают данные с сайтов несмотря на запреты

Ведущие ИИ-стартапы игнорируют настройки медийных сайтов, которые призваны не допустить бесплатный сбор их контента для тренировки моделей, узнал Business Insider.

Стартап TollBit выступает посредником между изданиями и ИИ-компаниями в сделках по лицензированию контента. Его специалисты выяснили, что некоторые ИИ-компании нарушают правила, и в прошлую пятницу уведомили об этом ряд крупных СМИ. Первым об этом сообщал Reuters, отмечая, что ИИ-компании в письме не назывались.

По словам двух осведомлённых источников BI, один из которых знаком с находками TollBit, речь идёт об OpenAI и Anthropic. Они либо игнорируют, ибо пытаются «обойти» файлы robots.txt, которые предотвращают автоматический сбор данных с сайтов. Хотя публично заявляли, что не нарушают их и другие настройки, блокирующие их краулеры GPTBot и ClaudeBot. В TollBit пришли к выводу, что это не так.

В OpenAI отказались от комментариев и сослались на майский блогпост, в котором говорится, что компания принимает настройки для веб-краулеров во внимание каждый раз при обучении новых моделей. В Anthropic не ответили на запрос.

Для создания передовых моделей нужно огромное множество качественных данных, которыми их владельцы не хотят делиться просто так. OpenAI уже заключила несколько сделок по лицензированию контента, например с медиаконцерном Axel Springer. Бюро авторского права США в этом году планирует ввести новшества в законодательство об авторском праве с учётом ИИ-реалий.

New York Times судится с OpenAI и Microsoft на миллиарды долларов за нарушение авторского права
New York Times судится с OpenAI и Microsoft на миллиарды долларов за нарушение авторского права
По теме
New York Times судится с OpenAI и Microsoft на миллиарды долларов за нарушение авторского права
OpenAI обвинила New York Times во взломе ChatGPT в суде
OpenAI обвинила New York Times во взломе ChatGPT в суде
По теме
OpenAI обвинила New York Times во взломе ChatGPT в суде
OpenAI: мы можем использовать произведения без разрешения авторов потому что делаем это добросовестно
OpenAI: мы можем использовать произведения без разрешения авторов, потому что делаем это добросовестно
По теме
OpenAI: мы можем использовать произведения без разрешения авторов, потому что делаем это добросовестно
Дорогое удовольствие: данные для ИИ имеют такую цену которую может позволить себе только бигтех
Дорогое удовольствие: данные для ИИ имеют такую цену, которую может позволить себе только бигтех
По теме
Дорогое удовольствие: данные для ИИ имеют такую цену, которую может позволить себе только бигтех
Читайте также
Лукашенко приехал открывать производство ИИ-телевизоров на «Горизонт». Ему показали доильный аппарат
Лукашенко приехал открывать производство ИИ-телевизоров на «Горизонт». Ему показали доильный аппарат
Лукашенко приехал открывать производство ИИ-телевизоров на «Горизонт». Ему показали доильный аппарат
4 комментария
10 главных событий из мира ИТ — итоги 2025
10 главных событий из мира ИТ — итоги 2025
10 главных событий из мира ИТ — итоги 2025
Прошедший год стал переломным для ИТ: искусственный интеллект вышел за пределы лабораторий и начал менять рынок труда, инфраструктуру и медиа-среду. Мы вспомнили самые яркие и значимые события ИТ-индустрии, о которых писали в этом году.
Общайтесь с людьми, а не ботами: долгие сессии с ИИ могут вызвать психозы
Общайтесь с людьми, а не ботами: долгие сессии с ИИ могут вызвать психозы
Общайтесь с людьми, а не ботами: долгие сессии с ИИ могут вызвать психозы
2 комментария
«Покажите деньги»: технотренды 2026 года по версии венчурных фондов
«Покажите деньги»: технотренды 2026 года по версии венчурных фондов
«Покажите деньги»: технотренды 2026 года по версии венчурных фондов

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.