Suchmaschinenoptimierung
   
 

SEMSEO Konferenz 2012
 

 
 

Biete: PHP-Skript um Duplicate Content zu finden

Gehe zu Seite 1, 2, 3  Weiter
Neues Thema eröffnen   Neue Antwort erstellen    ABAKUS Foren-Übersicht -> SEO Tools & Suchmaschinenmarketing-Tools
 Overture Tool funktioniert nicht mehr Suche ein best. Tool - Namen vergessen  
Datibesol

pr


: 22.01.2007
: 97
: Köln


: 12.07.2007, 11:31    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

Für die Leute, die immer noch manuell ihre Webseiten auf Duplicate Content überwachen, habe ich mal ein kleines (kostenloses) PHP-Skript geschrieben:
http://www.anotherseodomain.com/de/ueber_duplicate_content_check.html

Ist ausführlich kommentiert, so dass man es leicht an eigene Zwecke anpassen kann. Weitere Infos stehen auf der Webseite.

Besonders interessant wird es, wenn man das Skript zur Automatisierung einsetzt. So könnte man z.B. jede Nacht den Server einen Cronjob ausführen lassen, der nach DC der eigenen Seite sucht.
Nach oben
Datibesol Private Nachricht senden
Michael1967

pr


: 27.10.2005
: 2147



: 12.07.2007, 11:47    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

Wie muss ich das aufrufen?

Komandozeile von was?
Nach oben
Michael1967 Private Nachricht senden
Datibesol

pr


: 22.01.2007
: 97
: Köln


: 12.07.2007, 11:53    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

Unter Linux: Von der Shell aus
Unter Windows: Von der Dos-Box aus oder über "Befehl ausführen"

Du kannst aber auch die ersten Zeilen des Skripts so umschreiben, dass es stattdessen eine GET-Variable aus einem HTTP-Request nimmt.
Nach oben
Datibesol Private Nachricht senden
Michael1967

pr


: 27.10.2005
: 2147



: 12.07.2007, 19:23    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

Dos-Box?

Verstehe ich nicht, dann läd er das als Textdatei.

Wie genau sieht der Aufruf in der Dos-Box aus?

Sorry, hat sich erledigt. Lesen bildet *gg*
Nach oben
Michael1967 Private Nachricht senden
Gast








: 12.07.2007, 22:51    : Re: Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

Datibesol hat Folgendes geschrieben:
Für die Leute, die immer noch manuell ihre Webseiten auf Duplicate Content überwachen, habe ich mal ein kleines (kostenloses) PHP-Skript geschrieben:
http://www.anotherseodomain.com/de/ueber_duplicate_content_check.html

Ist ausführlich kommentiert, so dass man es leicht an eigene Zwecke anpassen kann. Weitere Infos stehen auf der Webseite.

Besonders interessant wird es, wenn man das Skript zur Automatisierung einsetzt. So könnte man z.B. jede Nacht den Server einen Cronjob ausführen lassen, der nach DC der eigenen Seite sucht.


naja. idee gut - umsetzung geht so... geht doch sicher auch einfacher ... so mit fensterchen zum was eingeben..

aber gleich nen fass mit noch ne seo seite aufmachen... iss schon hart:-))
alles wird gut.
Nach oben
Datibesol

pr


: 22.01.2007
: 97
: Köln


: 13.07.2007, 09:47    : Re: Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

SEO-SCHMIED hat Folgendes geschrieben:
naja. idee gut - umsetzung geht so... geht doch sicher auch einfacher ... so mit fensterchen zum was eingeben..


Wie auf der Seite beschrieben wird, geht es nur drum, die Logik zu demonstrieren wie so etwas funktioniert - damit Leute das für ihre eigenen Zwecke anpassen können.
Die Intention war nicht, eine bunte Windows GUI zu präsentieren; sondern ein Skript, das man mit wenigen Anpassungen auch auf einem Server laufen lassen könnte.


SEO-SCHMIED hat Folgendes geschrieben:
aber gleich nen fass mit noch ne seo seite aufmachen... iss schon hart:-))
alles wird gut.


Also ich wüsste nicht wo ich da ein "Fass" aufgemacht hätte.

Ich hätte die Erklärungen + das Skript auch auf eine meine anderen Domains legen können, nur hätte das thematisch absolut nicht gepasst.

Das Skript ist kostenlos - du kannst es benutzen oder es ignorieren.
Nach oben
Datibesol Private Nachricht senden
Michael1967

pr


: 27.10.2005
: 2147



: 13.07.2007, 09:53    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

Ja genau. Warum eigentlich nicht? Ich sehe hier kein Fass das aufgemacht wurde. Und außerdem ist es jawohl seine Sache, ob er eine neue Seite eröffnet oder nicht.
Nach oben
Michael1967 Private Nachricht senden
Gast








: 13.07.2007, 13:51    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

Michael1967 hat Folgendes geschrieben:
Ja genau. Warum eigentlich nicht? Ich sehe hier kein Fass das aufgemacht wurde. Und außerdem ist es jawohl seine Sache, ob er eine neue Seite eröffnet oder nicht.


klar - und es ist doch meine sache - wie ich darüber denke oder argumentiere ?

Mimosen Day hier, oder was ?
Nach oben
net(t)worker
Gast







: 13.07.2007, 14:50    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

SEO-SCHMIED hat Folgendes geschrieben:
klar - und es ist doch meine sache - wie ich darüber denke oder argumentiere ?

Mimosen Day hier, oder was ?


wie du darüber denkst ist wirklich deine Sache, bei der Argumentation spielen dann aber auch wieder ein paar Regeln bezüglich Sachlichkeit und freundlichen Umgangston eine Rolle.

Ich weis, dass hier der Umgangston nicht unbedingt der freundlichste ist, aber das bedeutet nicht, dass dies gutgeheißen wird... im Gegenteil, wir sind dabei hier ein bissl gegenzusteuern...

arbeite du da noch ein wenig dran und alles wird gut...
Nach oben
ole1210

pr


: 12.08.2005
: 6371
: Olpe


: 13.07.2007, 15:38    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

Habs jetzt nicht getestet, kann daher nichts zur Funktionsweise sagen, aber hab da doch zwei Fragen:

1.: Woher weisst du, was google als strafbaren DC erkennt?

2.: Kannst du das Tool nicht mit nen Crawler koppeln? Dann sehe ich, wer meinen Content klaut.

Starke Seiten suchen Linkpartner! Gerne auch neue Projekte!
Hier bohren für neuen Monitor: [X]
Nach oben
ole1210 Private Nachricht senden WWW AIM-Name
Datibesol

pr


: 22.01.2007
: 97
: Köln


: 13.07.2007, 16:20    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

ole1210 hat Folgendes geschrieben:
Habs jetzt nicht getestet, kann daher nichts zur Funktionsweise sagen, aber hab da doch zwei Fragen:

1.: Woher weisst du, was google als strafbaren DC erkennt?


Ausser Google selbst kann das niemand wissen (zumal sich das ja auch öfters ändert).

Die Vorgehensweise von dem Skript ist hier beschrieben:
http://www.anotherseodomain.com/de/beispiel_skript_duplicate_content_check.html
(Im Quelltext des Skripts sind noch mehr Infomationen in Form von Kommentaren).
Um es grob zusammenzufassen: Aus zehn unterschiedlichen Stellen des Textes werden Textschnipsel (aus jeweils 5 Wörtern) extrahiert. Wenn von diesen 10 Stichproben mindestens zwei auch auf einer anderen Webseiten vorhanden sind, dann wird für diese eine Verdachts-Meldung ausgegeben.

Im Quellcode sind auch Funktionen vorhanden, mit denen es möglich ist den gesamten Text (und nicht nur 10 Stichproben) zu checken und die prozentuale Ähnlichkeit zu berechnen (nur werden im jetzigen Beispiel-Skript diese Funktionen nicht aufgerufen).
Theoretisch könnte man das so umstricken, dass erst ab einem User-definierten Prozent-Wert gewarnt wird.


ole1210 hat Folgendes geschrieben:
2.: Kannst du das Tool nicht mit nen Crawler koppeln? Dann sehe ich, wer meinen Content klaut.


Das Tool gibt jetzt schon aus, welche genauen Homepage-URLs mindestens zwei Textschnipsel enthalten, die auch auf der Original-Seite enthalten sind.
Einen Crawler bräuchte man nur noch für einen prozentualen Ähnlichkeitsvergleich (die Vergleichs-Funktion ist schon implementiert, wird nur nicht aufgerufen).


Ursprünglich wollte ich nur das PHP-Skript mit einer kleinen Anleitung publizieren, damit sich da Webmaster ihre eigenen DC-Checks draus stricken können.
Aber ich sehe schon, die Leute wollen fertige Lösungen.
Ich hätte ein paar kleine Rückfragen an die Mitlesenden:

Welcher Anwendungsfall interessiert euch am meisten?
1) Ein PHP-Skript, dass automatisch jede Nacht auf eurem Server läuft und
im Falle von DC euch anmailt
2) Ein Windows-Programm mit GUI, bei welchem ihr die Startseite eurer Homepage angebt, und das dann alle Unterseiten crawlt und auf DC checkt
3) Eine HTML-Oberfläche
4) Eine Lösung die man in Artikel-Verzeichnisse o.ä. integrieren könnte
5) Garnichts, ihr haltet automatisierte Duplicate Content - Checks für unnötig oder habt schon eure eigene Lösung

In der jetzigen Version hat mir die ganze Sache kaum Arbeit gemacht, weil ich nur ein älteres, für mich selbst verfasstes Skript ein bisschen kommentiert und in einer bestimmten Version veröffentlicht habe.
Erweiterungen würde ich nur vornehmen, falls es überhaupt genug Interessenten gibt.
Nach oben
Datibesol Private Nachricht senden
Michael1967

pr


: 27.10.2005
: 2147



: 13.07.2007, 16:27    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

1) Ein PHP-Skript, dass automatisch jede Nacht auf eurem Server läuft und
im Falle von DC euch anmailt

3) Eine HTML-Oberfläche

4) Eine Lösung die man in Artikel-Verzeichnisse o.ä. integrieren könnte

Jepp!
Nach oben
Michael1967 Private Nachricht senden
Gast








: 14.07.2007, 00:36    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

[quote="net(t)worker"]
SEO-SCHMIED hat Folgendes geschrieben:
....

arbeite du da noch ein wenig dran und alles wird gut...


naja. idee gut - umsetzung geht so... geht doch sicher auch einfacher ... so mit fensterchen zum was eingeben..

aber gleich nen fass mit noch ne seo seite aufmachen... iss schon hart:-))
alles wird gut.

Dann bitte ich mal dezent darum

DEN TEIL DER UNFREUNDLICH WAR - ROT - ANZUMALEN
DEN UNSACHLICHEN BLAU oder sonstwie

Man könnte fast den eindruck haben - dir gehts darum deine posting statistik zu pushen ?

was ist unsachlich wenn ich anspreche das das eben auch besser ginge ?
wo war der faupin wenn ich das schreibe...

kein arsch penner sack doofmann - nichts dergleichen drin... also wo genau war ich bitte unfreundlich ?

und du als weitdenker der gegensteuert - dann sollsteste auch in die richtung gegensteuern - das eben nicht jeder mit der linux konsole umgehen mag - und das sicher vom ablauf nicht jedem geläufig ist wie das tool zu bedienen wäre

und nen fass aufmachen... hallo... kommt mal auf den teppich... man kann sich seine gründe an denen man sich festbeissen will auch selber zusammenschustern.

in dem sinne
Nach oben
net(t)worker
Gast







: 14.07.2007, 02:38    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

SEO-SCHMIED hat Folgendes geschrieben:

Dann bitte ich mal dezent darum

DEN TEIL DER UNFREUNDLICH WAR - ROT - ANZUMALEN
DEN UNSACHLICHEN BLAU oder sonstwie


hmm... du sagtest, dass es deine Sache sei was du denkst und wie du argumentierst... daraufhin habe ich dazu meinen Kommentar abgelassen... und genauso wie deine Aussage war meine nicht auf diesen Thread beschränkt....
Nach oben
ESeoC

pr


: 20.05.2007
: 44



: 14.07.2007, 16:37    : Biete: PHP-Skript um Duplicate Content zu finden Antworten mit Zitat

Idee gut, wie sieht es mit der Umsetzung aus?
Erwarten keine Wunder von einer Einzelperson.

Interessant wäre noch:
1) Ein PHP-Skript, dass automatisch jede Nacht auf eurem Server läuft und
im Falle von DC euch anmailt

3) Eine HTML-Oberfläche
Nach oben
ESeoC Private Nachricht senden
Neues Thema eröffnen   Neue Antwort erstellen    ABAKUS Foren-Übersicht -> SEO Tools & Suchmaschinenmarketing-Tools
Seite 1 von 3
Gehe zu Seite 1, 2, 3  Weiter

 






Ähnliche Beiträge
Thema Forum Antworten
Biete Texte - Urlaub in Bayern Biete Texte - Urlaub in Bayern Darleen72 Marktplatz: Dienstleistungen 0 24.05.2012, 20:52 Biete Texte - Urlaub in Bayern
Domains ohne Content sollen Hauptdomain unterstützen? Domains ohne Content sollen Hauptdoma... Stephano1986 Ich hab' da mal 'ne Frage 4 24.05.2012, 16:58 Domains ohne Content sollen Hauptdomain unterstützen?
duplicate content duplicate content frank-s Ich hab' da mal 'ne Frage 3 24.05.2012, 09:08 duplicate content
[S] Seo Content für Mode Blogs gesucht [S] Seo Content für Mode Blogs gesucht webmagic77 Marktplatz: Dienstleistungen 0 24.05.2012, 01:01 [S] Seo Content für Mode Blogs gesucht
Content von Penguin betroffener Domain wiederverwenden? Content von Penguin betroffener Domai... dirk81 Ich hab' da mal 'ne Frage 5 23.05.2012, 14:47 Content von Penguin betroffener Domain wiederverwenden?
[B] Wir finden die Worte, die Ihnen fehlen.... [B] Wir finden die Worte, die Ihnen f... billie Marktplatz: Dienstleistungen 0 21.05.2012, 19:46 [B] Wir finden die Worte, die Ihnen fehlen....
Doppel Content - bekommt man das wieder hin?? Doppel Content - bekommt man das wied... kekskauer Google Forum 2 21.05.2012, 18:33 Doppel Content - bekommt man das wieder hin??

Suchmaschinenoptimierung | Latent Semantische Optimierung (LSO) | SEO Blog | SEO Online Tools | Suchmaschinenmarketing Angebot | Online Marketing

Impressum

Dieses SEO Forum läuft unter phpBB.


Sie lesen gerade: Biete: PHP-Skript um Duplicate Content zu finden