Seite 1 von 1

Kurze Frage zur Indizierung in den Serps

Verfasst: 03.09.2018, 19:07
von grimbaldi
Die Seite https://fastwp.de listet über die Suche WP Agenturen.
Nun gibt es hier z.B. solche URL`s

https://fastwp.de/wordpress-agenturen/n ... rodenberg/

Diese wird indiziert - alles gut.
Nun wird aber die folgende URL auch indiziert:

https://fastwp.de/wordpress-agenturen/n ... igh_review

(also findet sich in den Serps)
und genau das soll natürlich nicht passieren. Vom System her werden diese URL`S mit
<link rel="canonical" href="https://fastwp.de/wordpress-agenturen/niedersachsen/" />

entsprechend ausgewiesen.

Warum werden Sie trotzdem indiziert? Fehlt hier etwas?

Verfasst:
von

Re: Kurze Frage zur Indizierung in den Serps

Verfasst: 03.09.2018, 19:51
von arnego2
grimbaldi hat geschrieben: Nun wird aber die folgende URL auch indiziert:

https://fastwp.de/wordpress-agenturen/n ... igh_review
So weit ich mich erinnere sagte Google einmal das man die Indexierung von verlinkten Seiten nicht verhindern kann. Auch wenn du ein <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> in dem Header deiner Seite hast ist es immer noch möglich das von außen etwas verlinkt ist und so seinen Weg in den Index findet.

Re: Kurze Frage zur Indizierung in den Serps

Verfasst: 03.09.2018, 21:37
von mogli
arnego2 hat geschrieben: So weit ich mich erinnere sagte Google einmal das man die Indexierung von verlinkten Seiten nicht verhindern kann. Auch wenn du ein <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> in dem Header deiner Seite hast ist es immer noch möglich das von außen etwas verlinkt ist und so seinen Weg in den Index findet.
Die Aussage stimmt nur teilweise. Bei dem von dir erwähnten Punkt meint Google die Indexierung von Seiten, die durch eine robots.txt eigentlich vom Crawling ausgeschlossen sind. Diese können trotzdem indexiert werden, wenn sie von außen verlinkt sind.

Allerdings betrifft das nicht Seiten, die die von dir erwähnte "<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">"-Angabe enthalten. noindex heißt noindex und wird beachtet. Wichtig ist natürlich, dass man die Seite dann eben NICHT per robots.txt blockiert. Denn dann kann der Crawler die Angabe ja nicht finden, weil er die Seite nicht aufruft.

Zum Thema/Vorfall selbst: Natürlich blöd, denn im Grunde sollte der Hinweis per canonical ausreichen. Bei dem von dir genannten Projekt klappt das leider nicht so gut, weshalb man sich mal über die zusätzliche Verwaltung von Parametern in der Search Console informieren könnte: https://support.google.com/webmasters/a ... 0550?hl=de

Natürlich stellt sich beim Durchschauen der Quellcodes (https://fastwp.de/wordpress-agenturen/n ... igh_review vs. https://fastwp.de/wordpress-agenturen/n ... webdesign/) auch die Frage, wieso (bei gleicher Optik) die Variante mit sort-Parameter fast doppelt so viele Zeichen (ca. 85.000) im Vergleich zur Variante ohne (ca. 45.000) hat.

Und das bei gleichsam minimiertem Code (hab ich mal manuell gemacht, weil sich die Seiten auch dahingehend unterscheiden).

Verfasst: 03.09.2018, 21:47
von staticweb
> Warum werden Sie trotzdem indiziert? Fehlt hier etwas?

Dann darfst du die Seiten wahrscheinlich nicht direkt verlinken, sondern mit Formularelementen arbeiten.

<div class="tip1 tip1a" style="max-width: 1775px;">
<a href="/wordpress-agenturen/niedersachsen/?sort_by=high_review">meiste Bewertungen</a>
<!--<a href="#">Most Viewed</a> -->
<a href="/wordpress-agenturen/niedersachsen/?sort_by=high_rating">beste Bewertungen</a>
<a href="/wordpress-agenturen/niedersachsen/?sort_by=employees">Anzahl Mitarbeiter</a>
<a href="/wordpress-agenturen/niedersachsen/?sort_by=hourly_rates">Stundensatz</a>
</div>

In den Webmaster Tools gibt es aber die Möglichkeit das Problem zu beheben. Natürlich nur für Google.

Re: Kurze Frage zur Indizierung in den Serps

Verfasst: 03.09.2018, 23:12
von arnego2
mogli hat geschrieben: Die Aussage stimmt nur teilweise. Bei dem von dir erwähnten Punkt meint Google die Indexierung von Seiten, die durch eine robots.txt eigentlich vom Crawling ausgeschlossen sind. Diese können trotzdem indexiert werden, wenn sie von außen verlinkt sind.

Allerdings betrifft das nicht Seiten, die die von dir erwähnte "<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">"-Angabe enthalten. noindex heißt noindex und wird beachtet. Wichtig ist natürlich, dass man die Seite dann eben NICHT per robots.txt blockiert. Denn dann kann der Crawler die Angabe ja nicht finden, weil er die Seite nicht aufruft.
Scheint zu stimmen was du meinst:
https://support.google.com/webmasters/a ... 3710?hl=en
:D :D

Selbst Google gibt zu das die Seite auch noch indexiert werden könnte.
google hat geschrieben:You should be aware that some search engine web crawlers might interpret the noindex directive differently. As a result, it is possible that your page might still appear in results from other search engines.

Verfasst:
von