Unter Duplicate Content versteht man Inhalte, die über mehr als eine URL gleichzeitig erreichbar sind. Suchmaschinen wie Google werten dies im schlimmsten Fall als Betrug – es droht eine Penalty.

Hintergrund

Abgesehen vom Einsatz im Black Hat SEO, wo bewusst Inhalte von anderen Seiten kopiert werden, sind es meist „Fehler“ in der Konfiguration einer Website die zu doppelten Inhalten führen. Üblicherweise unterscheidet man zwischen internem und externem Duplicate Content (DC).

Externer DC:
Unter verschiedenen Domains erreichbarer Content, z.B. erzeugt durch verschiedene Sprachversionen.
Interner DC:
Verschiedene URLs auf der eigenen Seite liefern den selben Content. Unterschiedlichste Ursachen, z.B. fehlender Trailing Slash ( „/“) am Ende eines Verzeichnisses

Liegt doppelter Content vor, stehen Suchmaschinen vor dem Problem, die für den User relevante URL zu identifizieren. Google erkennt zwar wenn z.B. Textbausteine notwendigerweise wiederholt werden (z.B. rechtliche Inhalte), allerdings sind die Grenzen oft fließend und das Worst-Case-Szenario einer Abstrafung ist stets möglich.

Was verursacht Duplicate Content?

Es gibt einige typische Fehler die doppelte Inhalte verursachen. In aller Regel sind diese recht einfach zu vermeiden. Typische Fehlerquellen wären:

  • fehlende Trailing Slashes: fehlende Slashes am Ende einer Verzeichnis-URL führen zu DC.
  • Seiten sind auch unter Subdomains erreichbar: wenn http://suchmaschinenoptimiert.com/duplicate-content/ und http://www.suchmaschinenoptimiert.com/duplicate-content/ eigenständig aufrufbar sind, ohne auf die jeweils andere weiter zu leiten, entsteht DC.
  • neue Domain: sind Inhalte beim Domainwechsel noch unter der alten Domain indiziert, ergibt sich durch die neue Domain Doppelter Content.
  • Paginierung: stetig an Einträgen wachsende Kommentarfunktionen mit der Seitenzahl in der URL werten Suchmaschinen oft als DC.
  • Groß- und Kleinschreibung in der URL: /Seite-A/ und /seite-a/ können als unterschiedliche Seiten mit dem selben Inhalt behandelt werden.

Wie vermeide ich Duplicate Content?

Um Suchmaschinen den Umgang mit gleichen Inhalten zu erleichtern gibt es unterschiedliche Möglichkeiten. Im Folgenden einige typische Maßnahmen um DC Herr zu werden:

  • die .htaccess-Datei: eine aus SEO Sicht ideale Möglichkeit um einen Redirect (HTTP-Statuscode 301) von einer alten URL bzw. Domain auf eine neue zu veranlassen. Durch die Umleitung wird doppelter Content auf der alten Seite so nicht zum Problem. Eine weitere Möglichkeit der .htaccess ist, mittels ModRewrite von einer Subdomain ohne www auf die www-Domain umzuleiten.
  • das hreflang-Attribut: gleiche Inhalte in unterschiedlichen Sprachen sind grundsätzlich kein Problem. Das gilt nicht für gleichsprachigen Content für unterschiedliche Länderversionen. In beiden Fällen wird jedenfalls empfohlen, Google mittels hreflang Link-Attribut über die Sprach- bzw. Länderversionen zu informieren.
  • Canonical-Tag: diese Information im Quelltext teilt Suchmaschinen mit, dass es von dieser Seite eine Standardversion gibt. Nur diese „Quellseite“ wird dann als zu indizierende Seite anerkannt.
  • noindex-Metatag: über diese Angabe im Quellcode wird die Seite grundsätzlich von der Indizierung ausgeschlossen.
  • Einzigartigkeit: generell ist darauf zu achten, dass Inhalte sich auf einer Website nicht wiederholen. Auch das Kopieren einzelner Textblöcke sollte vermieden werden. Wird eigener Content von Drittseiten verwendet, sollten diese auf entsprechende Maßnahmen (z.B. noindex) hingewiesen werden.

Die Methode doppelte Inhalte über die robots.txt auszuschließen wird von Google selbst ausdrücklich NICHT empfohlen.

Duplicate Content Tools

Es gibt natürlich einige Duplicate Content Checker. Mit folgenden kostenlosen Duplicate Content Tools konnten wir gute Erfahrungen machen:

FAZIT

Der Check auf Duplicate Content gehört zu den Kernaufgaben der Suchmaschinenoptimierung. Spätestens seit dem Panda Update hat Google ein besonderes Auge auf doppelten Content. Wer hier nicht sorgfältig arbeitet riskiert im schlimmsten Fall eine Penalty.

VIDEO: Googles Matt Cutts über DC

Weitere interessante Links zum Thema: