Doppelter Content-Definition-Schaden

Sie haben vielleicht mit viel Liebe aber garantiert mit viel Einsatz von Zeit, Wissen, Können ihre eigene Homepage-ihre eigene Website- online gestellt. Pflegen dies auch. Machten sich Gedanken was Sie wie schreiben und haben vielleicht auch noch recherchiert.

Auf der Website steht ihr Content, ihr Inhalt.

Es gibt jede Menge Menschen im Internet, die dies nicht respektieren, sondern schlicht und einfach nichts anderes tun, als ihre Arbeit zu stehlen.

Die Mitteln dazu sind so vielfältig wie das Internet selber. Aber deswegen nicht weniger unehrenhaft – sehr diplomatisch formuliert.

Es gibt zwei Arten von doppelten Content => !. externer und 2. Interner.

1.

Definition von „doppelter Content“

Wird ein und derselbe Inhalt einer Website unter mehreren Internetadressen gefunden, dann ist dies „doppelter Content“.

Der Schaden der entstehen kann durch doppelten Content

  1. 1. Bei den Suchergebnissen taucht auf einmal die andere Internetadresse auf, da sie vielleicht *stärker²* ist und die eigene Website landet weit hinten.
  2. 2. Irgendwann wird die eigene Website aus diversen Suchmaschinen ausgeschlossen, da doppelter Content bei den meisten Suchmaschinen verboten ist.
  3. 3. Es kann auch Hijacking passieren – wenn mehrere Faktoren zusammentreffen.

Erklärung (Definition getrau ich mich nicht zu schreiben, da es vermutlich mehrere Erklärungen zu dieser Frage gibt ) was ist eine stärkere Website:

1. Eine Website wird durch Backlinks gestärkt. Und auch, wenn es etlichs an SocialMedia Aktivitäten gibt.

2. Hat meine domain.tld weniger Backlinks als die andere Domain dann glaubt die Suchmaschine irgendwann die andere Domain hat das höhere Anrecht auf diesen Content und gibt dieser Domain den Vorzug, weil doch viele andere Websites darauf verlinken- diese also stärker wurde.

Einige der contentklau… Besitzer machen sich zumindest noch die Mühe mit copy&paste den Inhalt auf ihre Website zu holen. Andere schicken dazu Spider durch das Internet, die diesen wie ein riesiger Staubsauger aufsaugen.

Manche contenklau… Besitzer bringen sogar die Webmaster, gute Freunde, wohlgesonnene Menschen dazu, die Website freiwillig für den doppelten Content zur Verfügung zu stellen.

Wie schützt man sich vor doppelten Content?

  1. 1. Mod_rewrite.
  2. 2. Aussperren solcher Spider per htaccess.
  3. 3. Gezielt danach suchen: Ich gebe ganze Sätze unter Anführungszeichen in die Suchzeilen diverser Suchmaschinen und so finde ich die andere Domain , die mir mit doppelten Content Schaden wollen.
  4. 4. Das Tool von copyscape nutzen.
  5. Aufpassen auf RSS Anbieter -wenn sie ihr Feed freiwillig bei diversesten RSS Anbietern eintragen, achten sie vorher darauf, ob die den gesamten Arikel anzeigen oder nur Teile davon!

Ich fand doppelten Content, was kann ich nun tun?

  1. 1. Eine E-Mail an den Webmaster schreiben und verlangen, dass dies geändert wird.
  2. 2. Klagen.
  3. 3. Öffentlich machen.
  4. Bot-trap.de nutzen.

Ich gebe zu, dass ich es manchmal wirklich satt habe, all den contentklau’s nachlaufen zu müssen. Dass meine Geduld eine ruhige erste E-Mail zu senden immer weniger wird.

2.

interner doppelter Contente

Darunter leiden sehr oft Online-Shops. Produkte werden unter auf unterschiedlichen internen Seiten anders aufgelistet. zb Einmal nach Farbe, Preis oder Verfügbarkeit etc.

Dies kann aber auch bei Weblogs passieren, wenn man sehr viele Kategorien oder Tags nutzt und dann unter unterschiedlichen internen Internetadressen quasi ein und dasselbe anbietet.

Dies mag Google auch nicht, gleichzeitig bieten sie deswegen den neuen html tag rel=canonical an.

Wie nutzt man diesen rel canonical
Sie entscheiden sich welche der vielen Seiten ihres Shops, ihres Blogs ihnen am wichtigsten ist. Und genau für diese geben sie zwischen dem html tag head und /head den neuen tag an. Sie teilen Google damit mit: diese Internetadresse ist die „einzig richtige“ 😉

zb ich habe drei URLs, die alle fast dasselbe zeigen:

domain.tld/ich-bin-schoen/
domain.tld/ich-bin-schoen-guenstig/
domain.tld/ich-bin-schoen-bunt/

Sie haben sich entschieden, dass domain.tld/ich-bin-schoen/ die von ihnen bevorzugte Adresse ist, dann gehört zwischen dem html tag head und /head

<link rel="canonical" href="domain.tld/ich-bin-schoen/">

Google zum html tag rel=canonical

Es macht aber absolut keinen Sinn mit rel canonical auch die anderen Seiten anzugeben, das verwirrt ja wieder und ändert am internen doppelten Contente gar nichts.

Wie immer, ob interner doppelter Content wirklich schadet, wird von einigen SEOs bejaht, von einigen vehement abgestritten.
Ich mag ihnen nur aufzeigen, was sie tun können, wenn sie meinen er schadet, weil alles andere ist individuell zu lösen und ich kann nicht generell sagen, ob dies oder jenes besser ist. Jede Website ist anders und muss auch anders optimiert werden.

Artikelhistorie

Erstveröffentlichung: am 24.05.06 11.58
Insgesamt: 8mal bereits erneuert => zuletzt 2012

Fragen zum Thema

Aufgrund irr hoher Anzahl an Spamkommentare entschied ich mich hier die Kommentare zu schließen. Doch ich beantworte gerne Fragen zum Thema via E-Mail, wenn ich die Erlaubnis habe sowohl die Frage (anonymisiert) wie meine Antwort auch zu veröffentlichen => dann haben nämlich ganz viele was davon. Also keine Scheu, einfach ne E-Mail schreiben.

mts

Ebenfalls informativ und lesenswert

22 Kommentare zu “Doppelter Content-Definition-Schaden

  1. Mario

    Oh wie recht du hast, das ist echt nervig und ein wirklich massives Problem, selbst alte und starke Webseiten die jahrelang unangefochten beste Positionen bei Google hatten, rauchen gerade reihenweise ab.

    Das Problem ist, das die highjacker oftmals ausländische Seiten (Korea, China usw.) sind wo man fast keine Chance hat.

    Ich habe mehrfach Google zu dem Thema angeschrieben, mit exakten Fallbeispielen allerdings wie gewohnt nie eine Antwort erhalten und die Seiten sind immer noch da und unsere teilweise im Nirvana.Die .htaccess sind schon Seiten lang, täglich kommen neue dazu. Echt nervig diese Zecken.

  2. mts

    gsyi

    wie dort in zig Kommentaren zu lesen ist, werden all diese Probleme seit Jahren an Google rückgemeldet.
    Genauso wie das 302 Weiterleitungsproblem oder das URL mit www oder ohne Problem.

    Mein Vertrauen, dass diesmal darauf reagiert wird, wie mit BigDaddy ja versprochen wird, hält sich in mehr als engen Grenzen.

    Unabhängig davon, wenn ich darauf warten tät, wäre Wikipedia bereits um mindestens 10 meiner Texte -ohne Quellenangabe- reicher und stünde vor mir in den Suchergebnissen.

    Ich finde die Strategie Matt Cutt ins Rennen zu schicken wunderbar, geholfen hat sie den Webmastern bis dato kaum etwas.

    lg

    edit:upps ich hatte das „i“ bei Deinem Nick vergessen, sorry.

  3. gsyi

    Canonical URLs und Hijacking lassen sich leicht lösen. Was Duplicated Content angeht, spielt imho nicht nur die Stärke der Domain eine Rolle, sondern auch das Alter des Contents. Eins sollte man nicht vergessen, Google ist nur eine Maschine und kein Gott, jede Maschine macht Fehler, man sollte aber mit den Fehlern umgehen…

  4. Handykarten günstiger

    Sehr interessanter Artikel!
    Wie ist es denn eigentlich, wenn man für eine Website nur kurze Abschnitte (oder ein paar Absätze) eines Textes z.B. aus Wikipedia übernimmt? Wird das auch schon als doppelter Content gewertet?

    handykarten-angebot.de

  5. Reimer

    Moin,
    ich habe es leider auch schon häufig erlebt, dass nicht nur Text, sondern sogar Fotos geklaut wurden. Da hört der „Spaß“ dann aber wirklich auf. Allerdings mahne ich nicht ab, sondern bedanke mich in solchen Fällen für das Interesse an meinen Fotos, verbunden mit einer kleinen Rechnung als Nutzungsgebühr…

  6. Feng Shui berlin

    Mal ne kurze Frage an die Wissenden 😉
    Wie sieht es eigentlich aus, wenn man Pressemitteilungen auf seiner Seite veröffentlicht ? Da ist es ja der Sinn das diese von vielen Usern gelesen werden.
    Ist das DC und wird abgestraft ? Würde mich über Antworten freuen

    Danke sagt aufmassprofis.de
    feng-shui-beratungen-berlin.de

    edit von mts

    Grüß Dich Herr Feng Shui berlin

    Was meinst Du passiert, wenn ich Dich hier von WebDesign in de noch ein paar Mal mit Herr Feng Shui berlin anrede?

    Wie ich die Zeichen der Zeit so richtig interpretiere, ist innerhalb kürzester Zeit meine WebDesgin in de vor Deiner Website in den Serps.. das wage ich einfach zu behaupten.

    Vor allem auch deshalb, weil ich die URLs solcher Kommentare meist schneller lösche als die Augen da oben zwinkern können. 😉

    Du läßt mir aber aufgrund des Namens, den Du angabst ja gar keine andere Chance Herr Feng Shui berlin.

    Daher versteh ich diese Tat nicht – es ist unlogisch mir die Gelegenheit zu geben, Dein gutes Keyword sooft zu nutzen.

    Oder wie sollt ich Dich in meinem Antwortkommentar denn sonst anreden?

  7. mts

    Hallo Du der andere

    nein unsiinige Keys zu puschen ist nicht mein Metier, aber wer Linktausch mag, kann mich fragen und nicht so hintenherum..

    Die Antwort:
    ich beobachte derzeit – also so einige Wochen lang . dass Google die meta description und der jeweils andere title tag zur Erkennung von doppelten Content alleine nicht mehr ausreicht.

    Sondern immer öfter sehe ich, dass die obere Navigation als Navi erkannt wird und nicht gezählt wird, aber dann der erste Text im Content zur Wertung DC ja nein, herangezogen wird, daher empfehle ich immer diesen anderes zu halten.

    Ob jetzt so Newssticker im Gesamtkontext einer einzelnen Seite zu DC führen oder nicht hängt wohl auch von der Menge des anderen Inhalts ab.

    lg

  8. energieausweis-energiepass

    Das Problem ist ja, wenn man ein Artikel zum selbe Thema in verschiedenen Artikelverzecihnissen veröffentlichen will,
    da es zwangsläfig zu fast selbem Inhalt kommt. Man kann einfach die Kernaussagen eines Themas nicht komplett neu „erfinden „

  9. Micha

    Hey, angenommen ein Blog hat Gastblogger, die Ihre Beiträge auf dem Blog und auf Ihren eigenen Blogs veröffentlichten. Sollte man dann darauf achten dass sich die Beiträge unterscheiden oder gibt es dann irgendetwas zu beachten?

  10. Marketing Kuhn

    Hallo zusammen, ich hätte da mal eine Frage speziell zum Thema mit und ohne www. Sprich wenn die Site über beide Wege erreichbar ist. Über seitenreport zum Beispiel kann man ja seine Website checken lassen. Da wird bei mir angzeigt ich hätte duplicate content. In meine .htaccess habe ich aber die entsprechenden Änderungen vorgenommen. Ansonsten ist meine Seite relativ neu (da hat also glaube noch keiner geklaut) und über copyscape finde ich auch nix raus. Ich denke also entweder Fehler im Tool oder Fehler in meiner .htaccess. Gibt es noch mehr Möglichkeiten auf DC zu checken? Vielen Dank und Grüße

  11. mts

    es ist ein Fehler in Deiner htaccess 😉 Du siehst ja selbst, dass Du Deine Seite mit und ohne www voran aufrufen kannst

    lg

  12. Patricia Schmidt

    Hallo,
    ich habe nun auch (leider) ein Problem mit dem DC
    Ich werde nun nach 6 Jahren, mein Forum neu gestalten und nun soll auch ein Teil davon für die Öffentlichkeit zugänglich gemacht werden ( dies war bisher nicht der Fall, da ich ein geschlossenes Forum habe ).
    Für den öffentlichen Teil, benötige ich natürlich auch Berichte zum Thema. Nun habe ich bei einige Verbänden die sich mit dem Thema beschäftigen was ich behandele, die Erlaubnis bekommen, ihre Texte die bei ihnen auf der HP stehen, zu verwenden.
    Doch nun kann ich sie eigentlich nicht verwenden, weil ja DC
    Gibt es da irgendwie eine Ausnahmeregelung wenn man das einstellt und ja die Erlaubnis dazu hat ?
    Für Hilfe oder Tips wäre ich äußerst dankbar 🙂

    Lieben Gruß
    Patricia

  13. mts

    hmm
    doppelte Inhalte bleiben doppelt

    Was hilft ist
    eigene Meinung zum Thema,
    quasi wie eine „Erörterung“ und Zitate und dann auf die offizielle Quelle verlinken
    diese erhöht sowas wie die eigene Autorität

    Zeig ich auf, dass ich mir mein WIssen nicht aus dem Finger gezogen habe, sondern nachweisbar wo anders auch noch steht,
    wird meine Website mit der Zeit eine Autorität

    Ausprobieren, ob das funktioniert – quasi diese Texte als „Inspiration“ für eigene Inhalte nutzen.

  14. Birgit

    Hallo Monika,

    wie baue ich dann das link rel=“canonical“ … aber bei spezifischen WordPress-Seiten ein, da kann ich ja in dem Sinn nicht den Header editieren. Machst du das via Plugin oder was schlägst du da für WordPress-Anwender vor?

  15. mts

    grüß Dich Birgit, doch mit conditional comments kann man das lösen,
    prinzipiell wird rel canonical auf allen „Einzelansichten“ mal eingetragen, das kann man eben dann mit Abfragen und conditional comments sehr leicht ändern

  16. Birgit

    uff, danke, Monika, aber das ist mir jetzt zu hoch … hast du dazu einen Lesetipp für mich? Danke …

  17. mts

    das geht nur, wenn du ein standalone WP Theme hast,
    ein bisschen php solltest du können

    http://codex.wordpress.org/Conditional_Tags
    da findest du Anleitungen, wenn du mehr Hilfe brauchst, schreib mir einfach eine EMail und ich gebe dir dann ein Beispiel,
    zb du schreibst mir:ich hätt gern auf der Seite mit dem TItel X keinen canonical Tag dann kann ich dir ein Beispiel schicken
    wäre das ok für dich?

  18. Martin

    Hallo,

    schönen Dank für den aufschlussreichen Artikel! Ich habe dazu noch zwei Fragen:

    1. Auf unserer Seite haben wir mehrere Themenseiten angelegt. Die meisten Inhalte dieser Seiten sind einzigartig, außer ein paar Sätze bzw. Teilsätze die ähnlich klingen. Könnte das ein Problem für Suchmaschinen werden?

    2. Wie verhält es sich bei Webseiten die unter zwei Domains (.de & .com) mit komplett identischem Inhalt zu erreichen sind? Bin gerade dabei herauszufinden wie man das Problem lösen kann. Wenn ich Sätze der Website in der Googlesuche einfüge, taucht immer nur die eine Domain auf, die andere scheint aus dem Index entfernt worden zu sein, obwohl sie über mehr Backlinks verfügt. Für ein paar Tipps von euch wäre ich sehr dankbar 🙂

  19. mts

    grüß Dich,
    zwei Domains zu haben mit eindeutig demselben Inhalt ergibt absolut keinen Sinn. Daher schadet dies schlussendlich jeder der beiden Domains.
    Lösung: eine auf die andere umleiten oder auf beiden eindeutig anderen Inhalt bringen.

  20. Martin

    Hallo Monika,

    vielen Dank für die schnelle Antwort.
    Dass es keinen Sinn macht habe ich mir gleich gedacht 😉 leider hat es die Firma, die sich um die Webseiten bisher gekümmert hat so eingefädelt und dementsprechend auch die schlechten Rankings bisher.
    Wie sieht es aus, wenn ein Teil der Inhalte auf bestimmte Unterseiten gleich sind? Was muss eventuell noch bei der Umleitung per .htaccess beachtet werden, IP-Adressen etc.?

  21. mts

    wenn es für den .de Markt ist tät ich die .com einfach radikalst mit allem und jedem auf die .de umleiten. IP ist egal… Links umleiten
    die Texte der .de gut aufmotzen, toll verbessern und ändern und ein wenig Geduld haben und ob es dann gleich bessere Rankings gibt vermag ich ohne Kenntnis der anderen Sachen nicht zu sagen, aber gegenseitig bringt man sich nicht mehr um. Sprich die hauseigene Konkurrenz ist ausgeschaltet. 🙂