Seite 1 von 1

Googlebot und die Crux mit 301 Weiterleitungen

Verfasst: 15.05.2019, 13:40
von supervisior
Nur weils mir aus gegebenem Anlass mal wieder übelst aufstößt, hier mal ein paar Infos über Weiterleitungen und wie Google damit umgeht.

Eigentlich sollte man ja davon ausgehen, dass eine korrekte Weiterleitung mit einem mehr oder weniger langem Delay bei Google irgendwann mal berücksichtigt wird und die Original URL vom Goolgebot nicht mehr aufgerufen wird, aber weitgefehlt.

Ich hab zwar eine Tonne an Beispielen, aber hier mal 2 davon. Ich hab vor 3 Jahren etwa probehalber mit GET Parametern gearbeitet, um dafür etwas bestimmtes tracken zu können. Dabei habe ich schon bei der ersten Verwendung darauf geachtet, dass der Googlebot diese URLs mit GET Parametern nicht zu sehen bekommt und vorsorglich in der GSC einen Filter eingerichtet, dass Google diese URLs nicht indexieren soll. Dafür gabs in der alten GSC ja explizit diesen Filter. Was ich damals noch nicht wusste, war dass Google auch URLs von Nutzern abgreift, was Google als "Link Discovery" versteht.

In jedem Fall hat Google diese URLs mit GET Parameter in seinen Link Discovery Akt mit aufgenommen und anstelle der URL ohne GET Parameter fast nur mehr noch die URLs mit GET Parameter gecrawled, worauf ich für alle URLs, nachdem ich diesen Parameter nicht mehr gebraucht habe, eine Umleitung auf die URL ohne Parameter eingerichtet habe. Das Ganze liegt jetzt 3 Jahre zurück und noch immer ruft der Googlebot diese URLs auf und das ungebrochen jeden Tag mehrere 100 seit 3 Jahren.

Das betrifft aber nicht nur 301er, sondern auch 404/410. Manchmal hat das Logfile mehr Googlebot Einträge von nicht gefundenen Bildern als für erfolgreiche Aufrufe.

Mal abgesehen davon, dass das absolute Verschwendung bei der Crawling Leistung ist, muss man sich ernsthaft überlegen überhaupt Weiterleitungen einzurichten, wenn Google diese scheinbar ohnehin nicht berücksichtigt. Da scheint es fast besser zu sein und das ungeachtet, ob die Begriffe in einer URL falsch oder veraltet sind, diese URL zu belassen.

Verfasst:
von

Verfasst: 15.05.2019, 14:24
von staticweb
Es könnte daran liegen, dass die Seiten noch extern verlinkt sind. Dann dauert es meistens lange bis sehr lange.

Verfasst: 15.05.2019, 14:49
von supervisior
Negativ, sind die sie nicht.