Seite 1 von 1

Komische Einträge im Suchindex

Verfasst: 05.10.2015, 16:11
von dazzle89
Hallo,

mir ist nun öfters aufgefallen, dass seltsame Seiten im Index landen. Das habe ich mit der site: Abfrage festgestellt, ich denke, dass man die Seiten über normale Abfragen gar nicht angezeigt bekommt. Meine Fragen dazu:

1. Per site-Abfrage werden z.b. folgende Seiten angezeigt: www.domain.de/test/perl/test.pl oder www.domain.de/test/python/test.html

Liegt das an irgendwelchen Server-Einstellungen? Macht es Sinn, den test-Ordner per robots.txt zu sperren?

2. Bei einer anderen Domain habe ich das Problem, dass alle Seiten zwei mal gefunden werden, und zwar einmal ganz korrekt (z.B. domain.de/impressum.php) und jeweils noch zusätzlich mit einem index.php hinter der Domain (z.B. domain.de/index.php/impressum.php.
Wie kann das passieren, und was kann ich dagegen machen?

3. Ist das ganze schlimm? Die Seiten werden ja wie gesagt nur mittels site-Abfrage angezeigt...

Danke im Voraus.

Verfasst:
von

Verfasst: 07.10.2015, 10:26
von dazzle89
Kann mir niemand weiterhelfen? :(

Besonders das zweite Problem ist mir wichtig. Also dass meine Seiten doppelt indexiert werden, z.B. domain.de/index.php/impressum.php, obwohl die domain.de/impressum.php die korrekte Variante ist. Denn diese "falschen" Links werden in den Sitelinks angezeigt!

Ich will nur wissen wie das überhaupt passieren kann und was ich dagegen tun sollte. Canonical-Tag auf jede Seite? Oder diese Seite in der robots.txt sperren?

Danke..

Verfasst: 07.10.2015, 10:35
von elmex
dazzle89 hat geschrieben:Kann mir niemand weiterhelfen? :(

Besonders das zweite Problem ist mir wichtig. Also dass meine Seiten doppelt indexiert werden, z.B. domain.de/index.php/impressum.php, obwohl die domain.de/impressum.php die korrekte Variante ist. Denn diese "falschen" Links werden in den Sitelinks angezeigt!

Ich will nur wissen wie das überhaupt passieren kann und was ich dagegen tun sollte. Canonical-Tag auf jede Seite? Oder diese Seite in der robots.txt sperren?

Danke..
Verkorkste RewriteRules oder fehlerhafte Pfadbehandlung im Script sind daran schuld.

Und nein, ist nicht gut sowas - Stichwort Duplicate Content

Bloss wie sollen wir da helfen - ist ja deine Seite und wir kennen sie nicht, geschweige denn das System dahinter.

Verfasst: 07.10.2015, 10:41
von dazzle89
Danke schon mal für die Antwort.

Spricht was dagegen, wenn ich auf jeder Seite ein Canonical-Tag mit absoluter URL auf sich selbst setze? Um Google mitzuteilen, was das Original ist und dass die index.php/-Version hoffentlich gelöscht wird in den SERPs.