Support us

Google открыла код парсера файлов robots.txt

Оставить комментарий
Google открыла код парсера файлов robots.txt

Google опубликовала под лицензией Apache 2.0 код С++ библиотеки для разбора файлов robots.txt, содержащих правила (REP, Robots Exclusion Protocol) для исключения контента из области индексации ботами поисковых систем, сообщает OpenNet.

Также Google выступила с инициативой продвижения протокола REP в качестве официального интернет-стандарта после 25 лет его существования в роли стандарта де-факто.

Библиотека развивается уже около 20 лет, соответствует стандарту C++11 и учитывает различные нюансы оформления, встречающиеся в обиходе. Вместе с библиотекой также предложен код утилиты для проверки правильности определения правил в robots.txt. Представленный код используется в рабочих системах Google, выполняющих обработку robots.txt.

Исходный код библиотеки доступен на GitHub.

Читайте также
Google снова начнёт массово подавать сотрудников на процедуру для грин-карты — перестала в 2023
Google снова начнёт массово подавать сотрудников на процедуру для грин-карты — перестала в 2023
Google снова начнёт массово подавать сотрудников на процедуру для грин-карты — перестала в 2023
Главный ИИ-учёный Meta назвал общий ИИ «чушью». В Google не согласились
Главный ИИ-учёный Meta назвал общий ИИ «чушью». В Google не согласились
Главный ИИ-учёный Meta назвал общий ИИ «чушью». В Google не согласились
Год «бумерангов»: Google массово возвращает бывших сотрудников
Год «бумерангов»: Google массово возвращает бывших сотрудников
Год «бумерангов»: Google массово возвращает бывших сотрудников
Google попросила иностранных сотрудников не выезжать из США
Google попросила иностранных сотрудников не выезжать из США
Google попросила иностранных сотрудников не выезжать из США

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.