Seite 1 von 1

Zunehmend Probleme mit Duplicate Content

Verfasst: 23.05.2018, 21:41
von TryTryTry
Wir stellen in den letzten Monaten und Jahren ein immer größer werdendes Problem mit DC (duplicate content) fest.

Wir überwachen ja nicht nur viele eigene, sondern vor allem auch etliche Kunden & Partnerprojekte und es ist schon verblüffend, wie extrem die Problematik geworden ist und wie schlecht Google in vielen Fällen damit offenbar umgeht.

Und zwar geht es um professionellen Urheberrechtsverstoß, bzw. Contentklau.

Da werden etliche Artikel (teils komplette Webseiten) 1:1 kopiert und auf hunderte andere Projekte gelegt. Teils auch auf Portale wie Youtube (z.B. dort in die Beschreinung) und noch viele weitere Portale.

Links werden dabei rausgenommen und auch sonstige Sperren werden einfach umgangen. Man kann es schlicht nicht stoppen, sofern der Artikel oder die Bilder für einen normalen User noch sichtbar bleiben sollen.
Bei einigen Projekten wurden selbst nachträgliche Anpassungen am Text sofort mit übernommen (kopiert).

Mittels normaler Methoden kann man der Sache unmöglich Herr werden...viele Seiten werden im Ausland gehostet, verstecken die WHOIS-Daten oder es sind z.B. auch gehackte Seiten etc.....

Das Problem wird in den letzten Monaten gesamt immer größer und selbst riesige Partnerprojekte waren schon betroffen. Teils hat es wirklich große potente Projekte umgehauen.

Der Kampf wird immer mühseliger. Bei Youtube kann man bestimmte Videos/Kanäle ja noch aufwendig melden. Ab einer gewissen Größe auch leichter en masse....aber das dauert trotzdem immer ewig und es tauchen direkt danach sofort neue Kopien an anderer Stelle auf. Und YT ist ja auch nur 1 von 1000 Seiten, auf denen der Content verteilt wird.

Wir haben mal intern einen Test mit einer eigenen älteren starken Seite gemacht (die uns nicht wichtig war). Es hat das Projekt mit ausreichend Einsatz vollständig umgehauen. Google erkannte scheinbar irgendwann überall nur noch DC.

Aktuell wieder ein neuer Kunde, der uns um Hilfe bittet und das habe ich direkt auf den ersten Ansatz >2.000 exakte Kopien einer seiner Seiten gefunden, verteilt auf Servern und Portalen auf der ganzen Welt. Man kann den Übeltäter aber nicht identifizieren...


Jetzt meine Frage:
Hattet Ihr schon so extreme Fälle und was genau macht Ihr, um Eure Urheberschaft zu schützen und vor allem gegenüber Google zu sichern?
Das Ganze nervt nur noch, vor allem im Hinblick auf die DSGVO Hexenjagd...die Guten (die vernünftig arbeiten) jagd man und die BlackHats lässt man laufen...so kommt es mir leider immer mehr vor.

Verfasst:
von

Verfasst: 24.05.2018, 00:27
von Vegas
Die schnellste Methode dem Herr zu werden, ist über die DMCA Schiene. Bei Google einloggen, dann auf https://support.google.com/legal/contac ... raw=&hl=de

Bei 2000 Kopien echt Fleißarbeit, aber das Gute daran: Nach der Meldung bekommt der Betreiber, soweit Google den Angtrag akzeptiert, eine Benachrichtigung. Wenn er denn überhaupt einen SC Account hat. Reagiert er darauf nicht und widerspricht nicht, fliegt der Inhalt raus, fertig. Google prüft nicht die Rechtmäßigkeit der Anfrage, führt lediglich eine Plausibilitätsprüfung durch, um offensichtlich und zweifelsfrei unbegründete Anträge rauszufiltern. Der Vollständigkeit halber: Falsche Medlungen können Schadenersatzansprüche begründen.

Ansonsten kannst Du die Urheberschaft nicht vorab absichern, Google kann Urheberrechte nicht prüfen und sieht eine Erstveröffentlichung nicht als Urheberschaft. Findet Google Kopien, wird der Inhalt im Zweifel auf der Seite ranken, die am etabliertesten ist, sehr darwinistisch...aber wie soll Google auch prüfen, wem der Inhalt wirklich "gehört", geht technisch nicht.

Lange Rede, kurzer Sinn, DMCA funktioniert super, um Spammern die Inhalte klauen den Saft abzudrehen. Arbeit, aber immer noch besser als zu versuchen Leute zu finden, die nicht gefunden werden wollen und sich mit Hosts und Registraren, die im Zweifel immer ihre Kunden schützen, rumzuschlagen.

Verfasst: 24.05.2018, 01:44
von TryTryTry
Vegas hat geschrieben:Die schnellste Methode dem Herr zu werden, ist über die DMCA Schiene. Bei Google einloggen, dann auf https://support.google.com/legal/contac ... raw=&hl=de

Bei 2000 Kopien echt Fleißarbeit, aber das Gute daran: Nach der Meldung bekommt der Betreiber, soweit Google den Angtrag akzeptiert, eine Benachrichtigung. Wenn er denn überhaupt einen SC Account hat. Reagiert er darauf nicht und widerspricht nicht, fliegt der Inhalt raus, fertig. Google prüft nicht die Rechtmäßigkeit der Anfrage, führt lediglich eine Plausibilitätsprüfung durch, um offensichtlich und zweifelsfrei unbegründete Anträge rauszufiltern. Der Vollständigkeit halber: Falsche Medlungen können Schadenersatzansprüche begründen.

Ansonsten kannst Du die Urheberschaft nicht vorab absichern, Google kann Urheberrechte nicht prüfen und sieht eine Erstveröffentlichung nicht als Urheberschaft. Findet Google Kopien, wird der Inhalt im Zweifel auf der Seite ranken, die am etabliertesten ist, sehr darwinistisch...aber wie soll Google auch prüfen, wem der Inhalt wirklich "gehört", geht technisch nicht.

Lange Rede, kurzer Sinn, DMCA funktioniert super, um Spammern die Inhalte klauen den Saft abzudrehen. Arbeit, aber immer noch besser als zu versuchen Leute zu finden, die nicht gefunden werden wollen und sich mit Hosts und Registraren, die im Zweifel immer ihre Kunden schützen, rumzuschlagen.
Vielen Dank für die ausführliche Antwort. Mit genau dieser Methode arbeiten wir aktuell (neben einigen anderen) auch. Leider ist das mittlerweile echt viel Arbeit geworden. Ich hatte gehofft, es gibt noch irgendeine Methode, die ich noch nicht auf dem Schirm hatte.

Trotzdem...Deine Antwort war in jedem Fall hilfreich. Danke dafür.

Verfasst: 24.05.2018, 01:55
von Vegas
Gerne...aus eigener, leidvoller Erfahrung.

Verfasst: 24.05.2018, 15:36
von elmex
Lass einen Techniker mal drauf schauen, gerade bei der Variante, wo Änderungen übernommen werden, kann man da gut was machen. Diese Contentdiebe zeigen Muster beim Grabben der Inhalte, die kann man erkennen und dann dagegen vorgehen. Serverseitig zum Beispiel mit fail2ban. Projekte wie bot-trap (https://danielwebb.us/software/bot-trap/) unterstützen dabei, für ganz Faule gibt es auch online services wie bot-trap.de

Verfasst:
von