Google палічыла, што 60% інтэрнэту дублюецца

На дзеі Google Search Central Live у Сінгапуры Google падзялілася цікавай аналітыкай сеціва. Паводле яе разлікаў, каля 60% інтэрнэту дублюецца.

1 каментарый

Вядзецца, мяркуючы з усяго, не толькі пра тое, што нейкія даныя папросту капіруюцца і размяшчаюцца дзесьці яшчэ. Хутчэй, справа ў розных наладах сайтаў, пры якіх узнікаюць копіі. Але ў кампаніі ведаюць, як вырашыць пытанне дублявання даных. Трэба:

  1. выдаліць дублікаты пратаколаў — варта аддаць перавагу HTTPS.
  2. выдаліць www/non-www.
  3. выдаліць URL-адрасы з бескарыснымі параметрамі (ідэнтыфікатарамі сеансу).
  4. выдаліць варыянт з касой рыскай і без яе.
  5. выдаліць дублікаты кантрольнай сумы.  (Google параўноўвае кантрольную суму, згенераваную з асноўнага кантэнту. Калі дзве пары кантрольных сум супадаюць, яны лічацца дублікатамі).

Усё гэта дапаможа аптымізаваць рэсурсы і зрабіць працу пошукавых сістэм на сайтах лепшай і карэктнейшай.


Читать на dev.by