|
|
catcat


: 02.08.2006 : 10205 : Litauen
|
| : 16.01.2010, 13:29 : cuil-spider nervt |
|
|
Moinsen,
der verdammte spider von www.cuil.com hat die letzten 2 Tage meine shops besucht und zig GB-Traffic verursacht *narf
Ich hab den jetzt gesperrt. Aus die Maus.
Der google-bot ist irgendwie schlauer.
Der spidert wenigstens meine Produktattribute nicht durch.
Gib Dir das mal: Der spidert alle Produktattribute durch... Wenn 1 Artikel in 3 Farbkombinationen erhältlich ist, ich 40 Farben habe und 6 Größen dazu... dann sind das 40³x6 Seiten je Artikel. Im Schnitt habe ich ca. 250 Artikel in jedem Shop.
Das macht: 40³x6x250 Seiten = 96Mio.
Und dann geht das Mistding noch in die Suche und macht da weiter... 
User nicht mehr aktiv
catcat.cc |
|
| Nach oben |
|
 |
profo


: 18.01.2007 : 1709
|
| : 16.01.2010, 14:36 : cuil-spider nervt |
|
|
| Cuil ist der Moritz unter den Suchmaschinen... |
|
| Nach oben |
|
 |
3DCG

: 22.01.2006 : 545 : FFM
|
| : 16.01.2010, 15:01 : cuil-spider nervt |
|
|
Nach der Lachnummer die die geboten haben scheinen die es jetzt wieder zu versuchen die suchmaschine zu werden
. |
|
| Nach oben |
|
 |
jackwiesel


: 09.09.2007 : 5835 : Bochum
|
| : 16.01.2010, 15:17 : cuil-spider nervt |
|
|
Mich würde viel eher interessieren, wer den Spider von bigfinder.de programmiert hat. Ich hab hier ne winzige Handwerker-HP mit fünf Inhaltsseiten und der lutscht das Ding (da wurde seit drei Jahren nix geändert) im Schnitt 20 mal am Tag aus. Seit nem Monat darf er nicht mal drauf, "klopft" aber artig weiter in der gleichen Frequenz an... 
Suche Links zu diversen Themen: Präsente, Technik/Industrie, professionelle Pferdezucht |
|
| Nach oben |
|
 |
catcat


: 02.08.2006 : 10205 : Litauen
|
| : 16.01.2010, 15:54 : cuil-spider nervt |
|
|
bigfinder? Dem hab ich schon lange die Rote gegeben. Der spider ist von Eike gecoded worden, wetten?
Aber mal ne Frage: In welcher Sprache weden eigentlich spider und bots geschrieben? In C? C++ oder wat? Und welche Serverhardware wird da eigentlich benötigt? So ne Dinger verursachen doch sicher ne irre Serverlast, oder?
User nicht mehr aktiv
catcat.cc |
|
| Nach oben |
|
 |
Alda


: 27.01.2009 : 4591 : Kaiserslautern
|
| : 16.01.2010, 16:05 : cuil-spider nervt |
|
|
| 3DCG hat Folgendes geschrieben: |
| Nach der Lachnummer die die geboten haben scheinen die es jetzt wieder zu versuchen die suchmaschine zu werden. |
Es scheint wirklich so. In meinem Bereich ist deren Index mittlerweile nicht mal so schlecht.
.
Suche LT mit Handwerk, Bau, Ausbau Sanierung, evtl. auch mit regionalen Immoseiten o. ä. Domains mit PR 0, 1, 3 und 5 vorhanden, alles saubere, aktive Projekte mit sehr wenig ausgehenden Links. Bei Interesse PM.
Satelliten, reine Affili- oder LT-Sites und anderen Murks bitte stecken lassen. |
|
| Nach oben |
|
 |
profo


: 18.01.2007 : 1709
|
| : 16.01.2010, 17:10 : cuil-spider nervt |
|
|
| catcat hat Folgendes geschrieben: |
| Aber mal ne Frage: In welcher Sprache weden eigentlich spider und bots geschrieben? In C? C++ oder wat? Und welche Serverhardware wird da eigentlich benötigt? So ne Dinger verursachen doch sicher ne irre Serverlast, oder? |
Die Sprache ist vergleichsweise unwichtig, C++, Java, PHP, Perl, Google Go, was Du willst... Solange das Parsing der Seiten einigermaßen schlau gehalten wird, macht der IO die Hauptlast aus - also der Datentransfer und das Abspeichern. Insofern sind schnelle Festplatten wichtig, der Prozessor ist heute vergleichsweise wurscht. |
|
| Nach oben |
|
 |
seonewbie

: 21.10.2006 : 1759
|
| : 16.01.2010, 18:13 : softlayer.com besser ganz sperren! |
|
|
Da Cuil nicht auf die robtots.txt hört hatte ich den
Privider angeschrieben. Der fühlte sich nicht zuständig.
Eigentlich sollte das hier reichen:
User-agent: twiceler
Crawl-Delay: 10
Disallow: /
Geht der Bot aber einfach drüber. Das ist echt igorantes Pack
sowohl bei Cuil wie bei softlayer.com.!
Nun gut ich habe auf allen Routern die ich betreue
softlayer.com auf REJECT gesetzt.
Das IP Netz ist: 174.36.0.0-174.36.0.127
Solltet ihr auch machen wer sich nicht mal an die robots.txt
hält gehört überall ausgesperrt!
Suche Linktausch zum Thema Mode. Bitte PM
Backlink-Generator | Artikelverzeichnis | PageRank | SEnuke X
Don't smoke, don't fight, don't light no cigarettes,
Or else you'll wind up in the can!
No jokes, no rights, sit tight, don't fool around,
You are a guest of Uncle Sam!
AC/DC "I'll be damned" |
|
| Nach oben |
|
 |
catcat


: 02.08.2006 : 10205 : Litauen
|
| : 19.01.2010, 10:54 : cuil-spider nervt |
|
|
Danke seonewbie!
Hätt ich auch von selbst draufkommen können. Bin ich aber nicht
Hat eigentlich irgendwer nennenswerten traffic von cuil erhalten? Also ich nicht. Kein einziger user... nur ne bot-party in meinen shops.
Zeitweilig gaben sich da 3 bots von denen gleichzeitg die Kante. 110GB traffic. Find ich nich lustig. Die kommen mir nicht wieder ins Haus.
User nicht mehr aktiv
catcat.cc |
|
| Nach oben |
|
 |
Nullpointer

: 22.04.2005 : 4788 : West Berlin
|
| : 19.01.2010, 14:06 : cuil-spider nervt |
|
|
man müßte sowas wie ne botfalle implementieren 
Ich kann gar nicht so viel kotzen, wie ich fressen möchte. |
|
| Nach oben |
|
 |
catcat


: 02.08.2006 : 10205 : Litauen
|
| : 19.01.2010, 14:22 : cuil-spider nervt |
|
|
Man müsste den cuil-bot dazu bringen, die google-Serverfarmen zu spidern HARHAR.
Das wäre mal fies^^
User nicht mehr aktiv
catcat.cc |
|
| Nach oben |
|
 |
smilla

: 28.07.2008 : 161
|
| : 21.01.2010, 11:50 : cuil-spider nervt |
|
|
Ich hatte mit denen mal richtig stress, ich meinte dass ich deren Server auch mal spidern werde und dann drohten die mir gleich mit Anzeige
Ich wollte die immer noch Fragen welche IP's die haben, damit ich deren Bots keinen Content liefere, sondern einen Kackhaufen. Mich würde interessieren, was die darauf antworten würden  |
|
| Nach oben |
|
 |
seonewbie

: 21.10.2006 : 1759
|
| : 22.01.2010, 14:40 : Ist Cuil eigentlich schon mal verklagt worden? |
|
|
Das sind übrigens ein paar ehemalige Google Azubis die wohl nicht
übernommen wurden (Klar angeblich haben sie sich Selbstständig
gemacht weil sie es besser als Google machen wollten LOL)
und haben und jetzt aus Frusst Cuil gegründet.
Schlimm daran ist das die auch noch einen Geldgeber gefunden haben
der ihnen ermöglicht ihre Experimente ausserhalb des Klassenzimmers
zu veranstalten.
Die haben bei einem Kunden mehrere WordpressMU Server vollständig
lahm gelegt. Die Shopserver die ich betreue sind nur nicht in Mitleidenschaft
gezogen worden da alle PHP Seiten als html gecached werden. Ich bin
mir sicher das das eine Schadensersatzklage nach sich gezogen hätte
wenn die gestanden hätten.
Mich wundert das Cuil in den USA noch nicht verklagt wurde oder zumindest
beid er Cyber Crime Devision angezeigt wurde, da der
Robot wirklich so aggressiv ist das er normale PHP Systeme komplett
in die Knie zwingt wenn er sich einmal festgefressen hat.
Suche Linktausch zum Thema Mode. Bitte PM
Backlink-Generator | Artikelverzeichnis | PageRank | SEnuke X
Don't smoke, don't fight, don't light no cigarettes,
Or else you'll wind up in the can!
No jokes, no rights, sit tight, don't fool around,
You are a guest of Uncle Sam!
AC/DC "I'll be damned" |
|
| Nach oben |
|
 |
SeriousBadMan


: 16.06.2008 : 3749 : Welt
|
| : 22.01.2010, 19:01 : cuil-spider nervt |
|
|
Aber Cuil ist toll. Meine Seite, die seit nem Jahr in 1000 Filtern ist, rankt bei Cuil auf den Hauptkeys auf Rang1  |
|
| Nach oben |
|
 |
catcat


: 02.08.2006 : 10205 : Litauen
|
| : 22.01.2010, 19:04 : cuil-spider nervt |
|
|

User nicht mehr aktiv
catcat.cc |
|
| Nach oben |
|
 |