Was ist Duplicate Content?

Duplicate Content (abgekürzt oft nur DC) bedeutet doppelter Inhalt und meint inhaltsgleiche Seiten, die aber über verschiedene URLs aufrufbar sind.

Interner Duplicate Content …

Von internem Duplicate Content spricht man, wenn innerhalb einer Website bzw. Domain inhaltsgleiche Seiten auftauchen. Dies kann in Online-Shops der Fall sein, wenn verschiedene Kombinationen aus Kategorien und Produktfiltern letztlich zu identischen Ansichten führen. Außerdem kann die Struktur der URLs ursächlich sein, wenn z.B. eine Produkt-URL mit oder ohne Kategorien zum gleichen Ergebnis führt:

www.beispielshop.de/beispiel-kategorie/produkt-details
= gleiche Ansicht wie:
www.beispielshop.de/produkt-details

Andere Ursachen für internen DC können sein: Inhaltsgleiche Druckversionen einer Seite, Affiliate-IDs in der URL, dynamisch erzeugte Seiten oder verschiedene Länderversionen einer Website, die die gleiche Sprachversion nutzen.

… und externer Duplicate Content

Externer DC liegt dann vor, wenn der gleiche Inhalt auf verschiedenen Domains erscheint. Das kann unterschiedliche Gründe haben.

Häufige Ursache ist die Verwendung von Produktbeschreibungen eines Herstellers auf vielen Online-Shops. Hier lohnt es sich, eine eigene Beschreibung zu erstellen, um sich von Mitbewerbern abzugrenzen.

Im Extremfall liegt wirklich eine unberechtigte Nutzung von fremdem Content vor. Als betroffener Webseitenbetreiber sollte man sich zügig an den Webmaster der anderen Seite wenden und um Entfernung der Inhalte oder um die Setzung einer Quellenangabe bitten. Google stellt außerdem ein Formular bereit, mit dem man mitteilen kann, wenn man durch eine andere Seite von einer Urheberrechtsverletzung betroffen ist.

Warum ist Duplicate Content schlecht?

Google sucht im Netz nach einzigartigem, originärem Inhalt. Nur bei diesem nimmt Google an, dass es dem Nutzer einen echten Mehrwert bietet. Es zählt also nur das Original; gleichlautende andere Inhalte werden als Kopien gewertet.

Google will zudem vermeiden, dem Nutzer in den Suchergebnissen das gleiche Resultat mehrfach anzubieten. Das würde die Qualität der Suchergebnisse schmälern.

Kann Google nicht eindeutig zuordnen, welche Version die originale ist, kann dies zu Schwankungen im Ranking führen. Im schlimmsten Fall vermutet Google Betrug, nimmt also an, dass der Inhalt von einer anderen Webseite „geklaut“ wurde. Dies kann zur Abwertung der verdächtigen Seite führen, bis hin zur Entfernung aus dem Index.

Google selbst ist aber vor allem an Klarheit interessiert: Welche Seite stellt das beste Ergebnis für eine Sucheranfrage dar und gehört folglich auf Platz 1 der Suchergebnisse? Kann eine Website hier keine Eindeutigkeit liefern, schadet sie sich selbst.

Technische Lösungen für den Umgang mit Duplicate Content

Es lässt sich nicht immer vermeiden, dass Seiten einen identischen oder nahezu gleichen Inhalt haben. Für gängige Fälle gibt es folgende Lösungen:

  • .htaccess: Eine Lösung der DC-Problematik ist die Einrichtung von Weiterleitungen. Damit kann man z.B. vermeiden, dass eine Seite sowohl mit als auch ohne den Zusatz www gefunden wird. In der .htaccess-Datei auf dem Webserver trägt man eine 301-Weiterleitung ein, die bei Eingabe einer der Varianten automatisch zur anderen führt.
  • Canonical Tag: Wenn es mehrere Seiten geben muss, die von Google als Duplikate gewertet werden könnten, kann man das Canonical Tag einsetzen. Damit legt man fest, welche der fraglichen Seiten als das Original gelten soll. Die gewünschte URL wird, für den menschlichen Besucher nicht sichtbar, im Head-Bereich des Quelltextes benannt.
  • hreflang Tag: Auch dieses Tag wird im Header der Seite gesetzt. Es führt zusammengehörige Seiten als Liste auf und kann dafür Sprach- und Länderkürzel nutzen. So signalisiert es der Suchmaschine, dass es sich bei den gelisteten Links um legitime Varianten handelt.

Wenn Sie sich für eine Beratung durch takevalue entscheiden, können wir u.a. einen gründlichen Content Audit Ihrer Website durchführen: In diesem Rahmen identifizieren wir auch Fehler wie den hier geschilderten Duplicate Content, geben Ratschläge zur Behebung oder nehmen selbst die nötigen Korrekturen vor.