| Autor |
Nachricht |
redcan PostRank 4


Anmeldungsdatum: 25.04.2005 Beiträge: 147
|
Verfasst am: 31.10.2005, 13:00 Titel: Spider GONZO1 ?? |
 |
|
hallo zusammen,
kennt jemand den spider?
angeblich t-info.telekom.de, aber ip ist vom online dienst niederbayern
refferer "gonzo1 mailto:crawleradmin.t-info@telekom.de" |
|
| Nach oben |
|
 |
ckl PostRank 5


Anmeldungsdatum: 05.08.2005 Beiträge: 268
|
Verfasst am: 31.10.2005, 15:29 Titel: Spider GONZO1 ?? |
 |
|
Ist kein böser Bot - habe auch vor ein paar Tagen einen Tread eröffnet.
Der Bot speidert nur Deine Bilder, stimmts |
|
| Nach oben |
|
 |
redcan PostRank 4


Anmeldungsdatum: 25.04.2005 Beiträge: 147
|
Verfasst am: 31.10.2005, 17:47 Titel: Spider GONZO1 ?? |
 |
|
| nein, nur seiten aber reffer von telekom über ip von online dienst niederbayern ?? |
|
| Nach oben |
|
 |
DirkBl PostRank 1

Anmeldungsdatum: 01.11.2005 Beiträge: 9 Wohnort: Hamburg
|
Verfasst am: 01.11.2005, 08:11 Titel: Spider GONZO1 ?? |
 |
|
Das Ding gehört zu t-info.de, ist vielleicht nicht gefährlich, aber super lästig.....
Deshalb hier die Antwort des Crawleradmin:
Sehr geehrter Herr xxx,
um Zugriffe durch den Crawler auf Ihrer kompletten Site auszuschließen verwenden Sie bitte folgende Einträge:
User-agent: gonzo1
User-agent: gonzo2
User-agent: gonzo1P
User-agent: gonzo2P
Disallow: /
Mit freundlichen Grüßen,
Matthias Waltenberger
t-info GmbH
Dingolfinger Straße 1-15
81673 München
Tel. +49-89-59946-520
Fax +49-941-599299-123
Mail matthias.waltenberger@telekom.de
-----Ursprüngliche Nachricht-----
Von:
Gesendet: Donnerstag, 20. Oktober 2005 11:28
An: crawleradmin t-info
Betreff: Useragent?
Sehr geehrte Damen und Herren,
welchen Useragent muss ich in die robot.txt für Ihren Crawler eintragen, um Zugriffe auf unsere Site auszuschliessen? |
|
| Nach oben |
|
 |
redcan PostRank 4


Anmeldungsdatum: 25.04.2005 Beiträge: 147
|
Verfasst am: 01.11.2005, 09:57 Titel: Spider GONZO1 ?? |
 |
|
| super, danke für die info !!! |
|
| Nach oben |
|
 |
bull PostRank 10


Anmeldungsdatum: 20.09.2003 Beiträge: 2176 Wohnort: Vèneto
|
Verfasst am: 07.11.2005, 07:31 Titel: Spider GONZO1 ?? |
 |
|
Der Betreiber ist nach eigenem Bekunden dabei,
| Zitat: |
| eine neue Spezialsuchmaschine zu erproben, die in einigen Monaten live gehen wird - dann können wir Ihnen auch gerne nähere Informationen dazu geben. |
|
|
| Nach oben |
|
 |
Southmedia Community-Manager

Anmeldungsdatum: 20.07.2003 Beiträge: 7278 Wohnort: Karlsruhe
|
Verfasst am: 12.11.2005, 02:40 Titel: Spider GONZO1 ?? |
 |
|
Das ist aber nicht nett, ich würde gerne jetzt wissen wozu der Bot hier die ganze Zeit auf meinen Domains rumrödelt. _________________ Community-Management Abakus-Forum |
|
| Nach oben |
|
 |
ckl PostRank 5


Anmeldungsdatum: 05.08.2005 Beiträge: 268
|
Verfasst am: 12.11.2005, 13:38 Titel: Spider GONZO1 ?? |
 |
|
Also ich bin nach wie vor der Meinung, daß die versuchen eine Bilderdatenbank aufzubauen. Hatte in einem anderen Tread auch die Prob., daß Gonzo sehr stark auf meine Bilder aus war.....die haben Ihm so gefallen, daß er ganz und gar nicht mehr nach Hause wollte  |
|
| Nach oben |
|
 |
Bubo PostRank 1

Anmeldungsdatum: 21.02.2006 Beiträge: 9 Wohnort: Düsseldorf
|
Verfasst am: 21.02.2006, 15:05 Titel: Spider GONZO1 ?? |
 |
|
Hallo Leute,
seit heute nervt mich dieser Gonzo ziemlich heftig.
Eure Vermutung mit der Bilddatenbank könnte richtig sein, wir betreiben eine ziemlich grosse Fotohomepage - da gibt es einiges zu spidern
Leider stört er sich nicht an der robots.txt, also habe ich ihn in die .htaccess aufgenommen. Das stört ihn auch nicht
Also ist wahrscheinlich irgendetwas an meiner Syntax falsch. Könntet Ihr mal einen Blick darauf werfen und mir einen Tip geben?
Momentan sperre ich ihn über seine IP aus, ist zum Glück (bisher!) immer dieselbe.
Hier der Auszug aus dem Logfile:
| Code: |
| 212.34.175.72 - - [21/Feb/2006:09:22:00 +0100] "GET /xxxx.php HTTP/1.1" 200 5172 "http://www.url.de" "gonzo1[P] mailto:crawleradmin.t-info@telekom.de" |
In der .htaccess habe ich dann folgendes eingefügt:
| Code: |
.......
RewriteCond %{HTTP_USER_AGENT} ^gonzo1[P]\ mailto:crawleradmin.t-info@telekom.de [OR]
.......
|
Probiert - ohne Erfolg - habe ich auch folgendes:
| Code: |
.......
RewriteCond %{HTTP_USER_AGENT} ^gonzo1[P]\ (mailto:crawleradmin.t-info@telekom.de) [OR]
...........
|
Das hier funktioniert über Wannabrowser, aber lt. Logfile kommt er immer noch wieder durch:
| Code: |
.......
RewriteCond %{HTTP_USER_AGENT} ^gonzo1 [OR]
...........
|
Vielen Dank vorab für Eure Hilfe!
LG
Sandra
Zuletzt bearbeitet von Bubo am 21.02.2006, 16:14, insgesamt einmal bearbeitet |
|
| Nach oben |
|
 |
marc75 PostRank 10

Anmeldungsdatum: 06.10.2004 Beiträge: 1919
|
Verfasst am: 21.02.2006, 15:44 Titel: Spider GONZO1 ?? |
 |
|
| Zitat: |
Das ist aber nicht nett, ich würde gerne jetzt wissen wozu der Bot hier die ganze Zeit auf meinen Domains rumrödelt.
|
In einem anderen Forum hatte ich im letzten Jahr mal gelesen das der Bot ein Index aufbauen soll, ähnlich google, bzw. etwas spezialisiert. _________________ mfg
marc75 |
|
| Nach oben |
|
 |
Chris2005 PostRank 9

Anmeldungsdatum: 14.04.2005 Beiträge: 1290
|
Verfasst am: 21.02.2006, 17:28 Titel: Spider GONZO1 ?? |
 |
|
Probiere mal
| Code: |
RewriteCond %{HTTP_USER_AGENT} gonzo [OR,NC]
|
sollte helfen...
Gruss
Chris |
|
| Nach oben |
|
 |
Bubo PostRank 1

Anmeldungsdatum: 21.02.2006 Beiträge: 9 Wohnort: Düsseldorf
|
Verfasst am: 22.02.2006, 07:14 Titel: Spider GONZO1 ?? |
 |
|
Vielen Dank!
Die letzte Variante, die per Wannabrowser bereits funktioniert hat, hat dann nach ca. 45 Minuten auch bei Gonzo01 funktioniert.
Ist so eine Zeitverzögerung normal?
Wenn ich z.b. einen Typo in der .htaccess habe, bekomme ich sofort nach Hochladen einen Internal Server Error - da gibt es offensichtlich keine Zeitverzögerung.
Mannomann, als ich die Homepage vor einem Jahr auf die Beine gestellt habe, hätte ich nie gedacht, dass die Administration so in die Zeit geht!
LG
Sandra |
|
| Nach oben |
|
 |
|