Suchmaschinenoptimierung
   
 

SEMSEO Konferenz 2012
 

 
 

gibt es auch allow für die robots.txt Anweisung?

Neues Thema eröffnen   Neue Antwort erstellen    ABAKUS Foren-Übersicht -> Webprogrammierung, Templatedesign & Microformats
 Menü im Format | 1 | 2 | 3 | >>> mit JavaScript Zeichensatz der Datenbankverbindung anzeigen lassen?  
Thomas B

pr


: 04.12.2005
: 1781
: Hamburg


: 11.03.2010, 00:09    : gibt es auch allow für die robots.txt Anweisung? Antworten mit Zitat

Ich habe einmal eine bescheidene Frage.

Den Boot kann man ja mehr oder weniger mit einem "disallow" in der robots.txt aussperren.

Kann man das eigentlich auch so machen:

User-agent: *
Disallow: /
Allow: example.html

So dass erlaubt wird, die explizit ausgewiesene Seite zu spidern?
Nach oben
Thomas B Private Nachricht senden
Alda

pr


: 27.01.2009
: 4591
: Kaiserslautern


: 11.03.2010, 00:29    : gibt es auch allow für die robots.txt Anweisung? Antworten mit Zitat

Aua, ich geh da mal mit fundiertem Nichtwissen dran...

Alles was Du mit "Disallow" explizit ausschließt ist weg, da geht er nicht mehr ran.und wenn Du zuerst das Hauptverzeichnis komplett ausschließt wird (blanke Vermutung) der Rest nicht mehr abgearbeitet, weil es danach nichts mehr abzuarbeiten gibt.

.
Suche LT mit Handwerk, Bau, Ausbau Sanierung, evtl. auch mit regionalen Immoseiten o. ä. Domains mit PR 0, 1, 3 und 5 vorhanden, alles saubere, aktive Projekte mit sehr wenig ausgehenden Links. Bei Interesse PM.
Satelliten, reine Affili- oder LT-Sites und anderen Murks bitte stecken lassen.
Nach oben
Alda Private Nachricht senden
luzie

pr


: 12.07.2007
: 3343
: Hannover, Linden-Nord


: 11.03.2010, 00:30    : gibt es auch allow für die robots.txt Anweisung? Antworten mit Zitat

Njet!

Das geht nicht. Zwar akzeptiert Google "allow", aber nur global, so:

Allow : /

Was du in robots.txt auf "disallow" setzt, bleibt verboten, ein globales "disallow" ("disallow" ist die einzig wirklich vorgesehene Anweisung - Robots Exclusion Standard) kannst du nicht durch ein spezifisches "allow" wieder aufheben.

uzie- Google Official Bionic Top Contributor - Google Webmaster Help - SEO bei ABAKUS
Nach oben
luzie Private Nachricht senden E-Mail senden WWW Besuche das Xing-Profil dieses Users
chris3

pr


: 06.06.2008
: 434



: 11.03.2010, 00:32    : Re: gibt es auch allow für die robots.txt Anweisung? Antworten mit Zitat

Thomas B hat Folgendes geschrieben:

User-agent: *


google soll sich wohl nur daran halten, wenn man
"User-agent: Googlebot"
schreibt. es ist wohl schonmal öfters beobachtet worden, daß sich google nicht immer daran hält, wenn nur "User-agent: *" benutzt wird.
Nach oben
chris3 Private Nachricht senden
Thomas B

pr


: 04.12.2005
: 1781
: Hamburg


: 11.03.2010, 00:34    : gibt es auch allow für die robots.txt Anweisung? Antworten mit Zitat

Danke für die Infos.
Nach oben
Thomas B Private Nachricht senden
Mork vom Ork

pr


: 08.07.2008
: 2568
: Aufm Friedhof.


: 11.03.2010, 09:09    : Re: gibt es auch allow für die robots.txt Anweisung? Antworten mit Zitat

Thomas B hat Folgendes geschrieben:
Kann man das eigentlich auch so machen:

User-agent: *
Disallow: /
Allow: example.html

So dass erlaubt wird, die explizit ausgewiesene Seite zu spidern?

Das funktioniert aus zwei Gründen nicht:
1. URL-Pfade beginnen immer mit einem Schrägstrich, deine Angabe example.html wird dementsprechend nie zutreffen.
2. Die robots.txt wird standardmäßig von oben nach unten abgearbeitet, der erste Treffer wirkt. Dein Disallow: / passt auf alles, nachfolgende Allow:- und Disallow:-Zeilen werden nicht mehr beachtet.

Was du unterm Strich haben möchtest, ist dieses:

User-agent: *
Allow: /example.html
Disallow: /

Damit wird /example.com ausgelesen und alles andere gesperrt.

Zu Punkt 2 ist allerdings anzumerken, dass Google sich nicht an die althergebrachte Methode hält, sondern stattdessen zuerst alle Allow:-Zeilen auswertet, anschließend alle Disallow:-Zeilen. Mit deiner Reihenfolge würde es bei Google also doch so laufen, wie du möchtest; nichtsdestotrotz solltest du dich an den Standard halten.

Die Behauptung, Google würde Allow: nur mit / gelten lassen, ist übrigens falsch (und macht auch keinen Sinn). Nicht nur ich habe die Kombination Allow abc, Disallow abcde im Einsatz – abc ist im Index, abcde nicht, wie gewünscht –, sondern auch noch andere.
Gleiches gilt für die Aussage, „google soll sich wohl nur daran halten, wenn man "User-agent: Googlebot"“ nutzt. Ist auch nicht richtig.


Zuletzt bearbeitet von Mork vom Ork am 11.03.2010, 09:18, insgesamt einmal bearbeitet
Nach oben
Mork vom Ork Private Nachricht senden
KAW

pr


: 05.08.2004
: 3657



: 11.03.2010, 09:18    : gibt es auch allow für die robots.txt Anweisung? Antworten mit Zitat

Hallo,

ich habe zum Beispiel drin:

Code:
User-agent: googlebot

Disallow: /*?
Allow: /ordner/?*


Das wirkt zum Beispiel.
Alles auf der Domain mit einem Fragezeichen wird ausgesperrt, außer die Unterseiten im Ordner "ordner".
Da werden URL mit einem Fragezeichen auch indixiert.
Nach oben
KAW Private Nachricht senden
net(t)worker
Gast







: 11.03.2010, 11:40    : gibt es auch allow für die robots.txt Anweisung? Antworten mit Zitat

jo,

das mit dem Allow, zur freischaltung eines Teilbereiches eines vorherigen Disallow kann funktionieren, muss aber nicht, da es nicht zum allgemeinen Standard der robots.txt gehört... aber das trifft ja auf die wildcards wie * auch zu
Nach oben
Mork vom Ork

pr


: 08.07.2008
: 2568
: Aufm Friedhof.


: 11.03.2010, 17:23    : gibt es auch allow für die robots.txt Anweisung? Antworten mit Zitat

net(t)worker hat Folgendes geschrieben:
das mit dem Allow, zur freischaltung eines Teilbereiches eines vorherigen Disallow kann funktionieren

Nein, bitte andersrum, erst mit Allow freigeben, dann mit Disallow sperren. Diese Richtung schon immer Regel.
Nach oben
Mork vom Ork Private Nachricht senden
Neues Thema eröffnen   Neue Antwort erstellen    ABAKUS Foren-Übersicht -> Webprogrammierung, Templatedesign & Microformats
Seite 1 von 1

 






Ähnliche Beiträge
Thema Forum Antworten
Facebook Ads nun auch Mobile Facebook Ads nun auch Mobile Sojamilch Google Adwords & Facebook Ads, Yahoo!, Microsoft adCenter 0 07.02.2012, 19:34 Facebook Ads nun auch Mobile
[B] 150 Wiki Links, darunter auch .edu & .gov Enzyklopäd [B] 150 Wiki Links, darunter auch .ed... vital270 Marktplatz: Dienstleistungen 0 02.02.2012, 10:21 [B] 150 Wiki Links, darunter auch .edu & .gov Enzyklopäd
Unternehmen gesucht die auch ausbilden. Unternehmen gesucht die auch ausbilden. dacapo Offtopic, Spaßecke und alle sonstigen Themen 0 01.02.2012, 15:27 Unternehmen gesucht die auch ausbilden.
[B] 30x Edu Content Links darunter auch Stanford und Havard [B] 30x Edu Content Links darunter au... vital270 Marktplatz: Dienstleistungen 0 31.01.2012, 21:18 [B] 30x Edu Content Links darunter auch Stanford und Havard
Teliad bietet nun auch PresellPages an Teliad bietet nun auch PresellPages an werbe-muffel Google Pagerank und Backlink-Forum 68 30.01.2012, 13:02 Teliad bietet nun auch PresellPages an
Komplette Domain versehentlich mit robots.txt blockiert! Komplette Domain versehentlich mit ro... CyberNibbler Google Forum 4 29.01.2012, 13:09 Komplette Domain versehentlich mit robots.txt blockiert!
Welche Klicks zählt adsense? welche alltenativen gibt es? Welche Klicks zählt adsense? welche a... Olegator Ich hab' da mal 'ne Frage 7 26.01.2012, 21:07 Welche Klicks zählt adsense? welche alltenativen gibt es?

Suchmaschinenoptimierung | Latent Semantische Optimierung (LSO) | SEO Blog | SEO Online Tools | Suchmaschinenmarketing Angebot | Online Marketing

Impressum

Dieses SEO Forum läuft unter phpBB.


Sie lesen gerade: gibt es auch allow für die robots.txt Anweisung?