Suchmaschinenoptimierung
   
 

SEMSEO Konferenz 2012
 

 
 

Robots sperren: Wie definiert man Ausnahmen und IP-Blöcke?

Neues Thema eröffnen   Neue Antwort erstellen    ABAKUS Foren-Übersicht -> Spiders / Robots Themen
 Eine aktuelle Zusammenstellung von Bot-Ungeziefer ... Googlebot Deep Crawl / Unstimmigkeiten  
Hobby-SEO

pr


: 04.06.2005
: 338



: 29.10.2005, 02:39    : Robots sperren: Wie definiert man Ausnahmen und IP-Blöcke? Antworten mit Zitat

Hallo,

ich arbeite gerade an meiner .htaccess-Datei, um böse Bots u.ä. auszusperren. Ein ganz kleiner Auszug:

Code:
RewriteEngine on

RewriteCond %{HTTP_USER_AGENT} ^Alexibot [OR]
RewriteCond %{HTTP_USER_AGENT} ^asterias [OR]
...
...
# die etwas gefaehrlicheren Regeln weil komplexer und vielleicht zu viel verboten wird
RewriteCond %{HTTP_USER_AGENT} collect [NC,OR]
RewriteCond %{HTTP_USER_AGENT} crawl [NC,OR]
...
...
# geblockte IP Adressen
RewriteCond %{REMOTE_ADDR} ^195\.166\.237\.

RewriteRule ^.*$ spider\.htm [L]


Nun meine Fragen:

1. Angenommen, ich möchte den User-agent TollerCrawler, der ja auch von

RewriteCond %{HTTP_USER_AGENT} crawl [NC,OR]

erfasst wird, von der Verbotsliste ausschließen, ihm das Spidern meiner Website also erlauben: Wie geht das?

2. Angenommen, ich möchte nur die IPs 195.166.237.30 bis 195.166.237.40 sperren: Wie geht das?

3. Hat jemand Interesse daran, dass ich meinen "vollständigen" Regelkatalog, sobald er fertig ist, hier poste? (Kann im schlechtesten Fall noch ein bis zwei Wochen dauern.)

LG, Hobby-SEO
Nach oben
Hobby-SEO Private Nachricht senden
Hobby-SEO

pr


: 04.06.2005
: 338



: 29.10.2005, 08:17    : Robots sperren: Wie definiert man Ausnahmen und IP-Blöcke? Antworten mit Zitat

Hihi,

kaum ist meine allererste Antirobots-htaccess für ein paar Stunden online, ist auch schon ein Bot geblockt worden:

Code:
Host: 218.232.120.81
/robotsxx.txt
Http Code: 200  Date: Oct 28 19:33:03  Http Version: HTTP/1.0  Size in Bytes: 851
Referer: -
Agent: PlantyNet_WebRobot_V1.9 dhkang@plantynet.com

/
Http Code: 200  Date: Oct 28 19:33:04  Http Version: HTTP/1.0  Size in Bytes: 851
Referer: -
Agent: PlantyNet_WebRobot_V1.9 dhkang@plantynet.com


Scheint ein asiatischer Hersteller für Jugendschutzsoftware, also kein Böser, zu sein. Brauch den aber trotzdem nicht auf meiner Seite. Gegriffen hat übrigens die recht weit (zu weit?) gefasste Regel:

RewriteCond %{HTTP_USER_AGENT} robot [NC,OR]

Achja, eine Frage hätte ich auch noch: Welche Variante ist Server-schonender?

a. eine Liste a la RewriteCond %{REMOTE_ADDR} ^195\.166\.237\.
b. der weg über order deny,allow und deny from....

Oder hält sich das hinsichtlich der Serverbelastung in etwa die Waage?

LG, Hobby-SEO
Nach oben
Hobby-SEO Private Nachricht senden
Neues Thema eröffnen   Neue Antwort erstellen    ABAKUS Foren-Übersicht -> Spiders / Robots Themen
Seite 1 von 1

 






Ähnliche Beiträge
Thema Forum Antworten
Komplette Domain versehentlich mit robots.txt blockiert! Komplette Domain versehentlich mit ro... CyberNibbler Google Forum 4 29.01.2012, 13:09 Komplette Domain versehentlich mit robots.txt blockiert!
Wo ist robots  noindex, nofollow sinnvoll? Wo ist robots noindex, nofollow sinn... joku Ich hab' da mal 'ne Frage 3 07.01.2012, 12:29 Wo ist robots  noindex, nofollow sinnvoll?
Proxy IP sperren / IP herausfinden Proxy IP sperren / IP herausfinden marc77 Ich hab' da mal 'ne Frage 3 06.01.2012, 14:59 Proxy IP sperren / IP herausfinden
80legs ignoriert die robots.txt? 80legs ignoriert die robots.txt? CyberNibbler Ich hab' da mal 'ne Frage 4 06.01.2012, 14:01 80legs ignoriert die robots.txt?
Neues Projekt: Robots stürzen sich auf TAG-Clouds? Neues Projekt: Robots stürzen sich au... ElDiablo Google Forum 3 24.12.2011, 11:10 Neues Projekt: Robots stürzen sich auf TAG-Clouds?
USA sperren Internetseiten auf der ganzen Welt USA sperren Internetseiten auf der ga... SeriousBadMan Infos und heiße News 31 22.12.2011, 19:12 USA sperren Internetseiten auf der ganzen Welt
viele Einträge in robots.txt Auswirkungen aufs Ranking? viele Einträge in robots.txt Auswirku... okrim Google Forum 3 08.12.2011, 15:55 viele Einträge in robots.txt Auswirkungen aufs Ranking?

Suchmaschinenoptimierung | Latent Semantische Optimierung (LSO) | SEO Blog | SEO Online Tools | Suchmaschinenmarketing Angebot | Online Marketing

Impressum

Dieses SEO Forum läuft unter phpBB.


Sie lesen gerade: Robots sperren: Wie definiert man Ausnahmen und IP-Blöcke?