Canonical Tag: So schützt Du Dich vor Duplicate Content

7. März 2017  |     |  8 Kommentare
Ein Beitrag von Luisa

Canonicals helfen Dir dabei, Duplicate Content zu bekämpfen und die richtigen Inhalte bei Google zu ranken.  In meinem Blogpost erfährst Du, was das Canonical Tag genau ist, in welchen Fällen Du es einsetzen solltest, wie Du das machst und welche häufigen Fehler Du dabei vermeiden solltest.

Möpse symbolisieren Duplicate Content

Schwierige Entscheidung: Welcher der drei Möpse ist der richtige? Hilf Google mit dem Canonical Tag, den richtigen Mops – äh die richtige URL – zu ranken.

Warum gibt es Canonicals?

Manfred Mandel ist Online Marketer bei der Magic-Mandel-Fantasie GmbH. Vor einiger Zeit veröffentlichte er einen How-to-Artikel auf seiner Webseite. Diesen Artikel gibt es sowohl als Magazinbeitrag als auch als PDF. Jeden Tag checkt er die Suchergebnisse, um den Erfolg dieses Ratgeberartikels zu bewerten.

An einem Montagmorgen sieht er, dass statt dem Magazinbeitrag plötzlich dessen Druck-PDF rankt! Er muss sich vor seinem CEO verantworten, dieser ist nicht begeistert. Schließlich ist die angestrebte Leadgenerierung – eine Newsletteranmeldung – bei dem PDF nicht möglich.  Manfred soll schnellstmöglich eine Lösung finden. Das PDF will der CEO aber behalten, deindexieren darf Manfred es auch nicht. Er sucht verzweifelt nach einer Lösung und stößt dabei auf das Canonical-Attribut. Das klingt doch gar nicht schlecht…

Warum sind Canonicals für SEO wichtig?

Existieren auf Deiner Seite mehrere inhaltlich gleiche oder sehr ähnliche Seiten, kann sich Google oftmals nicht entscheiden, welcher Inhalt der relevanteste ist, zum Beispiel PDFs, Druckversionen und html-Seiten oder inhaltlich identische URLs mit und ohne Parameter. Anstatt sich für eine Seite zu entscheiden, indexiert Google dann oft alle Versionen und Du hast Duplicate Content bei Google im Index. Warum Google diesen nicht mag, kannst Du in Julians Blogpost zu Duplicate Content nachlesen.

Gleichzeitig ranken alle diese Versionen nicht so gut, wie es eine einzelne „Fassung“ könnte, wenn es nur sie gäbe. Im schlimmsten Fall kommt es sogar so weit, wie im Fall von Manfred Mandel: Google hat sich für einen Inhalt entschieden und rankt diesen auf den vorderen Rängen – aber nicht denjenigen, den Du präferierst. Mit dem Canonical Tag kannst Du Google darauf hinweisen, dass es eine Hauptversion dieser Inhalte gibt und es diese indexieren kann und soll. Der Canonical ist also durchaus ein wichtiges SEO-Instrument.

Was ist ein Canonical Tag?

Canonicals helfen Dir dabei, die rankende URL Deiner Seite zu steuern. Dies wird vor allem relevant, wenn Du gleiche oder sehr ähnliche Inhalte auf der Webseite hast: Das Canonical Tag ist ein Link im Quelltext einer Seite. Der Link der Duplikate zeigt dabei auf die sogenannte kanonische = repräsentative URL und kennzeichnet diese somit als diejenige URL, die Du im Index bevorzugen möchtest. Auch die kanonische URL besitzt einen Canonical: Dieser verweist jedoch auf sich selbst.

Richtigerweise spricht man übrigens gar nicht von einem Canonical Tag, sondern vielmehr von einem Canonical Link. Jedoch hat sich im Sprachgebrauch der Name Canonical Tag eingebürgert.

Einbinden des Canonical Tags

Den Canonical Link integrierst Du bei html-Dokumenten in den Head-Bereich der Seite. Um Fehler zu vermeiden, empfiehlt Google, die kanonische URL nicht als relativen, sondern als absoluten Link anzugeben. Die Originalressource verweist dabei auf sich selber, ihre Kopien und Varianten auf die kanonische URL.

<link rel=“canonical“ href=“https://www.dein-shop.de/kategorie-a/produkt-xyz“ />

Aufgeschlüsselt besagen die einzelnen Elemente des Canonicals folgendes:

<link: Öffnet das Link-Tag
rel=“canonical“: ist das eigentliche Canonical Attribut
href=“https://www.dein-shop.de/kategorie-a/produkt-xyz“ : Ist der Link zur kanonischen URL
/>: schließt das Link-Tag

Canonicals können auch bei PDFs und anderen nicht-html-Dateien integriert werden. Dazu müssen sie in den http-Header eingebaut werden und sehen folgendermaßen aus:

Link: <https://dein-shop.de/white-paper.html>; rel="canonical"

 Wie das genau geht, steht in diesem Blogpost der Internetkapitäne.

Anwendungsfälle für Canonicals

Die Anwendungsfälle für Canonicals sind eigentlich recht überschaubar. Im Grunde sind es vier Szenarien, in denen Canonicals helfen können:

Fall 1: Dynamische URLs

Viele Webseiten verwenden dynamische URLs, die den Inhalt der Seite nicht maßgeblich verändern: Zum Beispiel Sessions-IDs oder verschiedene Darstellungen einer Kategorieseite. Im Beispiel siehst Du eine Produktseite von S.Oliver, die aber auch über einen Parameter zu erreichen ist, der den Inhalt der Seite nicht ändert. S.Oliver ist ein Positiv-Beispiel für die Verwendung des Canonicals bei dynamischen URL. Der angehängte Parameter verändert den Inhalt der Seite nicht, also zeigt der Canonical der Parameter-URL auf das Original. Der Canonical der Originalseite zeigt auf sich selbst.

Beispiel richtiger Einsatz canonical tag

Der angehängte Parameter verändert den Inhalt der Seite nicht, der Canonical der Parameter-URL zeigt auf das Original. Der Canonical der Originalseite zeigt auf sich selbst. Gut gemacht! Screenshot: soliver.de

Tipp: Parameter solltest Du auch über die Search Console konfigurieren, um den Google Bot besser zu steuern.

Fall 2: Inhalte sind unter mehreren URLs erreichbar

Systembedingt kann es vorkommen, dass Deine Artikel unter verschiedenen URLs erreichbar sind, wenn Du sie in unterschiedlichen Kategorien einsortierst, also zum Beispiel:
www.dein-shop.de/roecke/lila-rock und www.dein-shop.de/sommermode/lila-rock
Auch in diesem Fall solltest Du Dich für eine kanonische URL entscheiden und die Variante per rel=“canonical“ auf diese verweisen lassen. Sofern es technisch und in Sachen Usability möglich ist, ist es jedoch – bis auf Einzelfälle – immer besser eine 301-Weiterleitung zu verwenden.

Wenn Deine Inhalte unter mehreren URLs erreichbar sind, zum Beispiel mit „www“, ohne „www“, mit Trailing-Slash, ohne Trailing-Slash UND Deine Entwickler eine 301-Weiterleitung technisch nicht umsetzen können, solltest Du auch das Canonical-Attribut verwenden, um eine bevorzugte Version festzulegen.

Fall 3: Inhalte in verschiedenen Formaten

In einigen Fällen ist es sinnvoll, Deine Inhalte in verschiedenen Formaten anzubieten – eine Checkliste zum Beispiel zusätzlich als Druck- oder PDF-Version. Wie im Fall von Manfred Mandel kann es dann passieren, dass Google die aus Deiner Sicht „falsche“ Version bevorzugt.

Ein Beispiel für eine fehlende Canonical-Anweisung in einem PDF findest Du, wenn Du nach „Checkliste für barrierefreies PDF – Einfach für Alle“ googelst:

Screenshot aus Google, Stand 06.03.2016, 16:26 Uhr

Der zugehörige http-Header lautet folgendermaßen:

Response Header Screenshot

Der http-Header des PDFs enthält keinen Canonical Link zur Originalressource. Quelle Screenshot: Web-Developer

Damit statt dem PDF das html-Dokument rankt, könnte einfach-fuer-alle.de im http-Header des PDFs einen Canonical Link auf die html URL setzen. Außerdem sollte im html-Dokument der Canonical auf die eigene URL zeigen. Somit wäre für Google verständlich, dass das PDF die „Kopie“ des html-Dokuments ist.

Fall 4: Inhalte auf anderen Domains

Ein Sonderfall sind auch noch so genannte Cross-Domain-Canonicals. Wenn Du Deine Inhalte auch auf anderen Domains veröffentlichst, kannst Du von Ihnen auch einen Canonical auf den Originalinhalt Deiner Webseite zeigen lassen. So ist es dann zum Beispiel möglich, Gastbeiträge 1:1 auf anderen Domains zu veröffentlichen. Die zugehörigen, positiven User-Signale könnten dabei Deinen Ursprungsartikel übertragen werden. Das SearchEngineJournal veröffentlicht einige Beiträge von Yoast, die kopierten Inhalte verweisen per Canonical-Attribut auf die Posts von Yoast.

Der Artikel des SEJ verweist per Canonical auf den Beitrag von Yoast. Screenshot: searcheinginejournal.com

Sicher ist, dass somit Duplicate Content vermieden wird. Nur der Beitrag von Yoast hat gute Rankings, während der Beitrag von Search Engine Journal für Suchmaschinen „unsichtbar“ bleibt. Interessant zu wissen wäre, ob positive Rankingsignale (Links, Userverhalten etc.), die bei Search Engine Journal erzeugt werden, sich dann auf den Artikel bei Yoast auswirken?

Hierfür gibt es keine Beweise oder Gegenbeweise, aber es wäre eigentlich eine logische Schlussfolgerung. Ebenso logisch wäre dann, dass man persönlich gute Artikel auf reichweitenstarken Seiten wiederveröffentlichen sollte, um dann von den potenziell höheren Usersignalen zu profitieren. Was haltet Ihr von dieser Theorie?

Häufige Fehler

Wir sehen in unseren Analysen immer wieder dieselben Fehler, die beim Einsatz von Canonicals auftreten. Das sind die häufigsten:

Die kanonische URL ist nicht erreichbar

Stelle immer sicher, dass die kanonische URL erreichbar ist. Einfach überprüfen kannst Du das, indem Du die Statuscodes der Canonicalziele checkst, zum Beispiel über einen Crawl mit OnPage.org & Co.

Gleichzeitiger Einsatz von rel=“canonical“ & „noindex“

John Mueller von Google hat es bestätigt: ein gleichzeitiger Einsatz von Canonicals und noindex ist unerwünscht und zwar aus folgendem Grund: Während der Canonical besagt, dass zwei Seiten identisch sind, besagt das „noindex“ Tag, dass die Seite nicht indexiert werden soll. Google muss sich dann folgende Frage stellen: Wenn diese Seite nicht indexiert werden soll, dann ihr Original auch nicht, oder?

Canonicals auf Paginierungsseiten

Verwende keine Canonicals auf hinteren Paginierungsseiten, um auf die erste Seite zu verweisen. Die Seiten sind nicht identisch, ihr Inhalt ist unterschiedlich, also macht ein Canonical Tag keinen Sinn.

Mehr als ein Canonical

Stelle sicher, dass Du immer nur ein Canonical auf jeder Seite hast. Verwendest Du mehrere, wird Google einfach alle Canonical Links ignorieren.

Canonical Tag bei zu unterschiedlichen Seiten

Nutze das Canonical Attribut nur, wenn die Seiten sich sehr ähnlich sind. Unterscheiden Sie sich zu stark, wird Google Deine Canonical-Anweisung nicht beachten. Um zu überprüfen, ob Dein Canonical von Google akzeptiert wird, kannst Du den „info:“ Such-Operator bei Google verwenden. Gib hinter den Operator die URL des Duplikats an, als Ergebnis sollte dann deren kanonische URL erscheinen:

canoncial yoast sej

Bildunterschrift: Der Beweis: Google akzeptiert den Canonical von SEJ zu Yoast. Screenshot Google, 28.02.2017

Canonical Link im <body> statt im <head>

Der Canonical sollte immer im Head-Bereich beziehungsweise http-Header stehen. Hast Du ihn woanders einfügt, wird Google ihn ignorieren.

301-Weiterleitung oder Canonical?

Mit dem Statuscode 301 teilst Du den Suchmaschinen mit, dass die Seite dauerhaft verschoben ist. Google crawlt nur noch das Weiterleitungsziel, nicht mehr die Ursprungsseite. Auch die User werden direkt auf die neue Seite geführt. Verwendest Du Canonicals crawlt Google die Duplikate weiterhin und auch die User können diese Seiten weiterhin aufrufen.

Manchmal ist es schlichtweg technisch oder aus Usability-Gründen nicht umsetzbar eine 301-Weiterleitung zu setzen – dann kannst Du mit Canonicals arbeiten. Auch, wenn die Inhalte in verschiedenen Formaten dargestellt werden, zum Beispiel als Druckversion und als „normaler“ Blogpost, kannst Du Canonicals statt einer Weiterleitung verwenden. Der Canonical ist für Google nur ein Hinweis – dem es in der Regel zwar folgt, aber der für Google nicht zwingend ist. Eine 301-Weiterleitung kann dagegen von Google nicht ignoriert werden.

Canonical und hreflang

Hreflang und Canonicals hängen stark zusammen. Akzeptiert Google eines von beiden nicht mehr, kann es Dir passieren, dass beide Anweisungen ignoriert werden. Pass also auf, dass jede Länderversion den Canonical auf die eigene Seite hat. Wie Du Canonicals und hreflang zusammen verwendest, habe ich auch in meinem Blogpost über hreflang erklärt.

Fazit: Canonicals sind wichtig!

Als Manfred Mandel der IT-Abteilung die Anweisung gegeben hat, für die Webseite der Magic Mandel Fantasie GmbH Canonicals zu implementieren und dabei auch nicht die PDFs auszusparen, dauert es nicht lange und er konnte seinem CEO die frohe Botschaft überbringen, dass nun wieder sein Ratgeber-Artikel bei Google in den Suchergebnissen erscheint. Für Manfred steht fest: Die Recherche über Canonicals hat sich gelohnt.

Brauchst auch Du Hilfe bei der Optimierung Deiner Seite? Wir unterstützen Dich gerne, stelle einfach unverbindlich eine Anfrage zu SEO.

Bilder: 1: © istock.com / Dixi_, 2: © istock.com / GlobalP

 

Jetzt teilen: Share on Facebook45Tweet about this on TwitterShare on Google+2Email this to someone

E-Book: Der Weg zum erfolgreichen Online Shop

  • Das 47-seitige E-Book mit 72 konkreten Tipps für Deinen Online Shop
  • Einmal wöchentlich exklusiver Content für das Marketing Deines Shops
  • Unser Newsletter (1-2x pro Woche)
E-Book kostenlos downloaden

8 Kommentare

Reaktionen auf diesen Beitrag

    • Stephan

      Sehr guter Artikel, vielen Dank. Eine Frage habe ich aber noch. Wo und wie kann ich in einem pdf eine Canonical-Anweisung hinterlegen?

      Vielen Dank vorab
      Gruß Stephan

    • Luisa

      Hallo Stefan,

      Bei einem PDF muss der Canonical Link im http Header eingebaut werden. Für das „wie“ empfehlen ich dir den Artikel von moz: https://moz.com/blog/how-to-advanced-relcanonical-http-headers
      Dort sind die verschiedenen Vorgehensweisen genau erklärt.

    • Sara

      Toller Artikel – wie immer 🙂

      Ich habe eine Frage zum gleichzeitigen Einsatz von rel=“canonical“ und „noindex“:
      Wir haben sehr viele Filter auf den Kategorie-Seiten in unserem Online Shop. Die gefilterten Seiten haben einen noindex und verweisen per Canonical auf die Kategorie. Ist das also eine schlechte Lösung?

      Vielen Dank und liebe Grüsse
      Sara

    • Luisa

      Hallo Sara,
      Genau, ihr solltet die gleichtzeitige Verwendung von „noindex“ und rel=“canonical“ vermeiden. Filterseiten sind noch einmal spezielles Thema. Einige Ansätze dazu findest du in Felix Beitrag zur Indexierung: https://www.seokratie.de/indexierung/

    • Ich mag diesen Schreibstil extrem, super Artikel mit viel Input.

      Wenn ich es richtig verstehe ist es so, dass bei einem A/B-Test, bei einer Seite die bereits organischen Traffic generiert, ein Canonical unerlässlich ist oder? Ich hatte immer den B-Test auf Noindex gestellt. Die Folge war, dass nach ein paar Wochen das Ranking komplett abgestürzt ist. Oder muss ein A/B Test komplett anders eingestellt werden?

      Beste Grüße
      Marcel Roll

    • Luisa

      Hallo Marcel,

      ja, ich würde den B-Test mit einem Canonical-Link auf den A-Test ausstatten.

      Liebe Grüße

      Luisa

    • Patrick

      Hallo Luisa,

      ein sehr schöner Artikel als Überblick zum Canonical!

      Ich hatte die ganze Zeit etwas zu den PDFs im Hinterkopf, was ich auch gefunden habe.
      https://www.seroundtable.com/google-pdf-duplicate-content-21842.html

      Das Statement war, dass man sich keine Gedanken um PDF und HTML Seite in Bezug auf doppelte Inhalte machen sollte.

      Was meinst du dazu?

      Grüße
      Patrick

    • Luisa

      Hallo Patrick,

      Wenn du das PDF nicht mit einem Canonical auf den html Inhalt auszeichnest, kann es passieren (kann, nicht muss!), dass statt der html Seite, das PDF rankt. Wenn die html-Seite eine FUnktion zu erfüllen hat – zum Beispiel Leadgenerierung über einen Newsletter o.ä., ist das natürlich nicht optimal.

      Selbst schon so gesehen. Ich würde in diesen Fällen also immer korrekt arbeiten und die Möglichkeit des Canonicals nutzen.

      Liebe Grüße

      Luisa

    Schreibe einen Kommentar

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

    Willst Du fit in SEO werden?

    Abonniere unseren Newsletter und bleibe in Sachen SEO, Inbound- & Online-Marketing auf dem Laufenden.

    Du kannst den Newsletter jederzeit wieder abbestellen.