В сети появилась громадная документация Google о работе поискового алгоритма
Беспрецедентная утечка 2500 страниц внутренней документации Google проливает свет на то, как происходит анализ и ранжирование сайтов её поисковым алгоритмом, а также свидетельствует, что компания многие годы, мягко говоря, была не совсем правдива по этому поводу.
Документация была выложена самой Google, видимо, по ошибке 27 марта на GitHub и находилась там до 7 мая, успев хорошо запечатлеться в интернете. Первым об утечке сообщил SEO-специалист Рэнд Фишкин, после него подробный разбор сделал его коллега Майк Кинг. Содержащаяся в ней информация в основном техническая и будет, скорее, интересна и полезна специалистам по поисковой оптимизации и разработчикам, чем рядовым пользователям.
Например, в ней детализируется, какие данные Google собирает с веб-страниц и сайтов, какие сайты поднимает выше в выдаче по чувствительным темам, таким как выборы, какова политика в отношении небольших сайтов и многое другое.
Некоторые подробности расходятся с публичными заявлениями представителей Google. Например, по их словам, для ранжирования веб-страниц не используются данные Chrome, однако в материалах из утечки браузер напрямую упомянут в пассажах о показе сайтов в выдаче. Другой пример касается роли метрики EEAT (Experience, Expertise, Authoritativeness, Trustworthiness) для оценки надёжности источников информации. Судя по документации, компания отслеживает атрибут авторства контента на страницах. Это может влиять на ранжирование, хотя Google заявляет, что это не так.
Сама Google пока никак не комментирует ни ситуацию, ни подлинность документов.
Читать на dev.by