Seite 1 von 1

Sistrix Crawler Session ID XT Commerce 4.1

Verfasst: 06.03.2014, 11:19
von marting
Hallo!
Seit ein paar Tagen versuche ich nun schon vergebens die Session ID aus den Crawling-Ergebnissen bei Sistrix zu bekommen.

Shop: XT Commerce 4.1
Bei Sistrix ist es möglich einen User Agent zu vergeben, z.B. sistrixtz

Ich habe schon versucht die Session ID über:
/xtFramework/library/bots/bots.txt
dort erst sistrixtz reingeschrieben und schon andere Kombinationen mit bot oder crawl.

und über die robots.txt zu sperren
User-agent: sistrixtz
Disallow: /*?sessionid

Nun weiß ich vorerst keine Möglichkeit mehr die man austesten könnte.

Verfasst:
von

Verfasst: 06.03.2014, 18:40
von STB
Ich würde eher versuchen, das Ganze nicht über Einstellungen auf Deiner Website zu lösen, sondern Sistrix selbst zu kontaktieren.

Die Frage wäre, ob Sistrix sich überhaupt über die Angaben in der robots.txt schert. Die Crawler von Google tun es ja auch nicht und indexieren fröhlich fast alles.

Kann Dir aber nur Sistrix beantworten ;-) Rein technisch sollte es eigentlich zu lösen sein, die Session IDs rauszufiltern.

Verfasst: 07.03.2014, 11:12
von marting
Hi,
der Support von Sistrix hat mir dazu geraten, dies über die htaccess zu regeln..
als Eintrag konnte ich hierzu dies finden:
in die htaccess...

php_value session.use_trans_sid 0

ist das korrekt ?
oder muss dort RewriteCond verwendet werden ?

Verfasst: 11.03.2014, 14:54
von marting
Noob.. einfach nächstes Mal die von xt commerce mitgelieferte bots.txt nicht mit nem Texteditor öffnen sondern mit dreamweaver, sublime etc.
User-Agent bei Sistrix manuell festlegen und dann klappt die Sache auch.