Informationen zu Canonical Tags • Antworten auf Fragen!
Das Canonical Tag (man spricht auch von 'Canonical
Link', 'Canonical
URL' oder 'URL Canonicalization') ist ein weiterer Schritt der
großen Suchmaschinenbetreiber (insb. Google), um des 'Duplicate Content' Herr zu werden. Duplicate Content beziehungsweise Near-Duplicate Content liegt vor, wenn
zwei oder mehrere Seiten (unterschiedliche URLs) gleiche oder fast gleiche Inhalte zeigen. Duplicate
Content kann sich negativ auf das Suchmaschinen-Ranking einer Internetseite
auswirken, da Suchmaschinen doppelte Inhalte filtern, um den Usern keine
inhaltsgleichen oder sehr ähnlichen Treffer anzuzeigen, die die Qualität der
Suchergebnisseiten (SERP) mindern würden.
l Letztes Update:
25.08.2024
Das Canonical Tag in einem Satz erklärt:
Eine kanonische URL ist eine bevorzugte bzw. repräsentative URL von mehreren URL-Versionen mit
jeweils ähnlichem
oder gleichem Inhalt ("Duplicate Content"), die man Suchmaschinen
durch das
Setzen eines zusätzlichen Meta Tags ("Canonical Tag") auf den
nicht-kanonischen URLs mitteilen kann.
Oft besteht Duplicate Content - ohne, dass man sich dessen bewusst ist!
Wenn beispielsweise nur zwei dieser URLs über das Shop- oder Content-Management-System
(CMS) erreichbar sind und die gleiche Seite zeigen, liegt bereits Duplicate Content vor:
Content ist mit und ohne "www" aufrufbar: http://www.ihreseite.de
http://ihreseite.de
Content ist sowohl über "http" als auch über "https" aufrufbar: http://www.ihreseite.de
https://www.ihreseite.de
Content ist sowohl mit als auch ohne "Slash" aufrufbar: http://www.ihreseite.de/verzeichnis
http://www.ihreseite.de/verzeichnis/
Content ist mit dargestellter Index-Datei und ohne diese aufrufbar: http://www.ihreseite.de/
http://www.ihreseite.de/index.php
Content ist auch mit Tracking-Parametern aufrufbar: http://www.ihreseite.de/produkte.html
http://www.ihreseite.de/produkte.html?tracking_id=xyz
Seite ist auch mit Session-IDs aufrufbar: http://www.ihreseite.de/produkte.html
http://www.ihreseite.de/produkte.html?session_id=xyz
Für Partner kommen Affiliate-IDs zum Einsatz: http://www.ihreseite.de/landingpage.html
http://www.ihreseite.de/landingpage.html?affiliate_id=xyz
Content ist mit Groß- und Kleinschreibung aufrufbar: http://www.ihreseite.de/Page-A.html
http://www.ihreseite.de/page-a.html
Content ist über mehrere Ansichten aufrufbar: http://www.ihreseite.de/artikel.html
http://www.ihreseite.de/artikel_print.html
Content ist über mehrere Filter aufrufbar: http://www.ihreseite.de/produkte.html?sort=newest
http://www.ihreseite.de/produkte.html?sort=oldest
Was kann man tun, um Duplicate Content generell zu
vermeiden?
Hier einige Möglichkeiten:
> Definieren Sie einen URL-Standard und richten Sie eine 301-Umleitung von
allen gleichen (Neben)-Seiten auf die Standardvariante ein.
> Richten Sie eine XML-Sitemap ein und zeigen Sie Suchmaschinen auf diese
Weise, welches die Standard-Variante der URL ist.
> Stellen Sie sicher, dass alle internen sowie externen Backlinks, auf die
Sie Einfluss haben, auf die gleiche URL-Variante verweisen.
> Schließen Sie bei der Verwendung von Duplicate Content erzeugenden
Parametern diese in der "Parameterbehandlung" der Google Webmaster Tools aus
(Website-Konfiguration >> Einstellungen >> Parameterbehandlung).
In welchen Fällen empfiehlt sich der Einsatz von Canonical Tags?
Wenn man keinen Zugang zu dem Administrator der Webseite hat, um einen 301-Redirect einzurichten oder sich Duplicate
Content systembedingt einfach nicht vermeiden lässt (beispielsweise, wenn
auf einer Seite keine Weiterleitung erwünscht ist, wie bei zum Beispiel beim
Aufruf der Druckversion oder einer Filterseite in einem Online-Shop).
Wie sieht ein Canonical Tag aus und wie wird er verwendet?
Ein Canonical Tag wird in den Head "<head>" einer Seite gesetzt, die Duplicate
Content produziert (Canonical Tags sind den übrigen Meta-Tags hinzuzufügen).
So würde beispielsweise die Seite http://www.ihreseite.de/produkte.html?session_id=xyz folgenden Canonical Tag erhalten: <link rel="canonical" href="http://www.ihreseite.de/produkte.html"
/>
Vorteile von Canonical Tags:
> Der Eingriff kann direkt auf einer einzelnen Seite vorgenommen werden -
quasi an
"Ort und Stelle", weswegen auch oftmals von einer "Mini 301" gesprochen
wird.
> Es sind keine Programmierkenntnisse notwendig, Konfigurationen am
Webserver entfallen.
> Die Reputation einer (alten) Seite wird voll vererbt (wie bei einer
"301").
> Der Google PageRank verteilt sich nicht mehr auf mehrere Seiten mit
ähnlichem oder gleichem Content, sondern wird auf einer per Canonical Tag
definierten Hauptseite gebündelt.
> Es ist nun möglich, eine alternative Standardseite zu definieren, ohne auf
diese umzuleiten -
zum Beispiel dann, wenn eine Umleitung auch gar nicht gewünscht ist (wie
etwa bei der Verwendung von Session-IDs oder Tracking-Parametern).
> Es ist ein "Standard", der suchmaschinenübergreifend unterstützt wird
(bisher von Google, Yahoo und Bing/Microsoft).
Warum sollte jede Seite ausgezeichnet
werden (Canonical-Tag auf sich selbst)?
Auf diese Weise umgeht man schon präventiv potentielle spätere Duplicate-Content Probleme und ist ein für allemal gewappnet.
Beispielsweise kann es sein, dass später einmal (Werbe-)Partner mit den URLs
angehängten Tracking-Parametern
zu Ihrer Seite verlinken und Suchmaschinen so in Kenntnis von neuen Adressen kommen.
Eine andere Möglichkeit ist, dass Ihre Webseite von Scrapern besucht wird und
ganz oder teilweise doppelt im Netz verfügbar ist - in diesem Fall
würde dann gleich die Canonical-Tag-Auszeichnung mit kopiert werden und
dafür sorgen, dass auf Ihre Domain verwiesen wird.
Canonical Tag plus Disallow,
Noindex und/oder Nofollow?
Getreu des Mottos "Doppelt hält besser" vermag man geneigt sein, Duplicate
Content URLs via robots.txt und der Direktive "Disallow" zu blocken und/oder
die Duplicate Content Seiten auch noch mit dem Noindex und Nofollow Attribut
zu versehen.
Enthalten die Duplicate Content URLs angehängte Parameter, könnte man zudem
noch in den Google Webmaster Tools die "Parameterbehandlung" zusätzlich
heranziehen.
Ist das alles notwendig, um des Duplicate Content Herr zu werden?
Nein!
Google empfiehlt nur den Canonical Tag zu setzen, nicht jedoch
stattdessen oder zusätzlich eine Methode zu verwenden, die die URL blockt
oder ausschließt.
Exkurs: Nie die Direktive "Disallow" und den "Noindex" Meta-Tag
zusammen verwenden. Das "Disallow" verhindert nämlich, dass Google die Seite
auslesen und das Noindex bzw. den Canonical Tag überhaupt "entdecken" kann!
Fragen und Antworten (FAQ):
F: Wie lange gibt es den Canonical Tag schon? A: Am 12.02.2009 haben sich Google, Yahoo und Microsoft auf die Einführung
geeinigt.
F: Wo genau wird das Canonical Tag platziert? A: Das Canonical Tag muss im Head eines Web-Dokuments innerhalb der <head></head> Tags eingefügt
werden.
F: Vererben Canonical Tags den Google PageRank? A: Ja, die Vererbung der Reputation ist mit einer 301-Weiterleitung
gleichzusetzen.
F: Was versteht Google unter Duplicate Content genau? A: Google definiert Duplicate Content rein über die
Inhalte, also im Wesentlichen die Texte, d.h. Layout oder Design spielt
keine Rolle. Duplicate Content auch nur vor, wenn die gleiche
User-Zielgruppe adressiert wird, d.h. inhaltsgleiche Seiten sind
unproblematisch, wenn sie bspw. einmal für Desktop-User und einmal für
mobile User oder einmal für User in Deutschland und einmal für User in der
Schweiz bereit gestellt werden.
F: Kann man per Canonical Tag auch auf eine externe Domain verweisen? A: Ja, das ist seit Ende 2009 "theoretisch" auch möglich,
sollte aber nicht die erste Wahl sein (dazu auch Video weiter
unten auf dieser Seite) -
Blog-Post im Google-Blog
F: Kann man per Canonical Tag auch auf eine (andere) Sub-Domain verweisen? A: Ja, es ist möglich, das Element auf verschiedenen Hostnamen einer Domain
zu verwenden.
F: Meine Website funktioniert mit HTTP und HTTPS, nützt mir das Canonical
Tag? A: Ja, man kann von dem HyperText Transfer Protocol Secure (HTTPS) auf das
HyperText Transfer Protocol (HTTP) verweisen oder umgekehrt, um eine Version
als Standard zu definieren.
F: Kann man den Canonical Tag nur für absolut identische Seiten einsetzen? A: Nein, das Canonical Tag funktioniert auch bei "ähnlichen" Seiten (Near-Duplicate
Content).
F: Was passiert, wenn per Canonical Tag auf eine Seite verwiesen wird, die
wiederum auf eine anderen Seite per Canonical Tag verweist? A: Das Canonical Tag funktioniert auch einer Kette mehreren mit Canonical
Tags versehenen Seiten, es wird jedoch empfohlen, gleich auf die finale
Seite zu verweisen.
F: Soll ich "absolute" oder "relative" URLs in den Canonical Tags verwenden? A: Beides ist möglich, zu empfehlen sind aber "absolute" URLs.
F: Kann man auch gleich mehrere ähnliche Seiten per
Canonical Tag auf eine einzige Hauptseite verweisen? A: Ja, ein identisches Canonical Link Element kann auch auf
mehreren Seiten gleichzeitig implementiert werden.
F: Was ist der Vorteil einer 301-Weiterleitung im Vergleich
zum Canonical Tag? A: Eine 301-Weiterleitung ist eine absolute Direktive. Ein
Canonical Tag wird von Suchmaschinen "nur" als Hinweis interpretiert (dem
jedoch in der Regel gefolgt wird).
F: Lässt sich das Canonical Tag auch im HTTP-Header platzieren? A: Ja, das ist mittlerweile auch möglich, dazu ein
Blog-Post im Google-Blog
F: Kann man mit dem Canonical Tag auch auf unterschiedliche
File-Typen verweisen? A: Ja, das ist über den HTTP-Header möglich - bspw. von PDF
zu HTML - dazu ein
hilfreicher Blog-Post
F: Das CMS oder das Shop-System erlauben es nicht, einen
Canonical Tag zu setzen - was kann man alternativ tun? A: Erstellen Sie eine XML-Sitemap mit den hauptsächlichen
URLs. Google wird es als Signal werten, dass diese URLs die kanonischen URLs
sind, wenn mehrere zum gleichen Content gefunden werden. Werden Duplicate
Content URLs durch angefügte Parameter erzeugt, empfiehlt sich zudem die
Parameterbehandlung in den Google Webmaster Tools zu verwenden.
F: Canonical Tag auf der Startseite: Sollte die Domain
im Canonical Tag am Ende mit oder ohne Slash gesetzt werden? A: Ob die Domain bzw. Root-URL beim Canonical Tag auf der Startseite mit
oder ohne Slash gesetzt wird, spielt keine Rolle - Google sieht es als
äquivalent an.
F: Werden durch einen Canonical Tag auch "+1en" von Google+
übertragen? A: Nein, eine Übertragung findet derzeit nicht statt, die
"+1en" sind fest an die URL gekoppelt, für die sie ursprünglich abgegeben
worden sind.
F: Sollten die nicht-kanonischen URLs zusätzlich auf
"noindex" gesetzt werden? A: Nein, mit dem "noindex"-Attribut könnte es zu einem
Konflikt kommen, denn Google betrachtet die URLs als äquivalent und mit
einem "noindex"-Attribut kommuniziert man Google, dass der Content nicht
indexiert werden soll.
Canonical Tag bei (fast) gleichem Content auf
Länder-Domains:
Viele Betreiber von Online-Shops kennen das Problem: Es existieren für
verschiedene Länder separate Domains mit fast dem gleichen Inhalt - bspw.
shop.de / shop.at / shop.ch (DACH). Dabei gibt es lediglich geringfügige
Unterschiede wie bei den Preisen, den Versandbedingungen oder auf der
Startseite.
Was ist zu tun, damit Google hier keinen Duplicte Content wittert?
Google empfiehlt in diesem Fall den Canonical Tag mit dem Meta Tag-Element
rel="alternate" hreflang="x" zu kombinieren - die Vorgehensweise sieht wie
folgt aus:
1. Legen Sie eine Mutter-Domain fest - bspw. die deutsche "shop.de"
2. Verweisen Sie auf den duplizierten ".ch" und ".at"
Tochter-Domains per Canonical Tag auf die
Mutter-Domain "shop.de" und setzen Sie:
<link rel="canonical" href="http://www.shop.de/" />
3. Fügen Sie nun jeder Domain die rel="alternate" hreflang="x"
Meta Tag-Elemente der eigenen und weiteren
Lokalisierungen hinzu:
Bedeutung:
de: deutscher Content, unabhängig von der Region de-at: deutscher Content für Nutzer in Österreich
de-ch: deutscher Content für Nutzer in der Schweiz
Hinweise:
• Das Meta Tag-Element rel="alternate" hreflang="x" funktioniert
wie das Canonical Tag individuell auf Seitenebene, so dass einzelne URLs/Unterseiten
individuell ausgerichtet werden müssen (nicht die Domain als Auszeichnung
verwenden).
• Google stellt auf der Suchergebnisseite (SERP) in jedem Fall immer das Snippet
der kanonischen Haupt-Domain dar (in diesem Beispiel: "shop.de"). Insofern
sollten in "Title" und "Meta-Description" keine länderspezifischen Inhalte
gesetzt werden.
• Übersetzte Inhalte/Seiten stellen keinen Duplicate Content
dar - Suchmaschinen sehen den Content nicht als dupliziert an sondern stufen
ihn als "unique" ein. In diesem Fall sollten keine Canonical Tags
gesetzt werden, sonder ausschließlich das Meta Tag-Element rel="alternate"
hreflang="x".
• Dieses Thema ist detailliert noch einmal nachzulesen in dem offiziellen
Google Blog
für Deutschland sowie auf der US-amerikanischen
Google Mutterseite
Tipp: Dieser "hreflang Tag Generator" erleichtert die Arbeit:
hreflang Tag Generator
Wichtiges Update: Mittlerweile ist man bei Google zurückgerudert und empfiehlt nicht mehr, Canonical
Tag und hreflang Meta-Tag bei gleichsprachigen Seiten zu kombinieren, wie der folgende
Eintrag im US-amerikanischen Google Webmaster Blog (s.o.) zeigt, bei dem die
entsprechende Passage nun durchgestrichen und mit einem Hinweis versehen
worden ist:
Canonical Tags bei mobilen Seiten für Smartphones:
Wer eine mobile Website für Smartphones mit separaten URLs für Mobilgeräte
und Desktops einsetzen möchten, sollte Canonical-Tags implementieren.
Konkret werden auf den mobilen URLs (bspw. m.domain.com) Canonical-Tags als
Verweise auf die Desktop-URLs gesetzt (bspw. www.domain.com).
So würde beispielsweise die mobile Seite http://m.domain.com/ueber-uns/ folgenden Canonical Tag erhalten: <link rel="canonical" href="http://www.domain.com/ueber-uns/"
/>
Im Gegenzug erhält die Desktop-Version http://www.domain.com/ueber-uns/ folgenden Alternate Tag: <link rel="alternate" media="only
screen and (max-width: 640px)" href="http://m.domain.com/ueber-uns/"
/>
(die "media"-Angabe kann natürlich variiert werden)
Hinweis: Nachdem auf beiden Seiten-Typen die Tags gesetzt sind,
sollte drittens noch eine entsprechend ausgezeichnete XML-Sitemap
eingerichtet werden:
Wer für das Hosting seiner Internetpräsenz einen Apache-Webserver nutzt (und
das ist die überwiegende Mehrheit), hat die Möglichkeit, Canonical Tags
ebenfalls für alternative Dateitypen, wie bspw. der Formate PDF, Word,
PowerPoint oder Excel einzurichten. Insbesondere über das PDF-Format werden
ab und an Website-Inhalte optional zur HTML-Version zur Verfügung gestellt.
Leider produzieren solche alternativen Ausgabeformate Duplicate Content, da
sich die Inhalte der Website wiederholen und Google Dateien des Typs ".pdf",
".doc", ".ppt", ".xls" etc. neben "normalen" Webseiten ebenfalls als Treffer
listet.
Um hier keine Duplicate-Content Problematik entstehen zu lassen, lässt sich
für diese Dateien über die .htaccess ein Verweis auf die HTML-(Mutter)-Seite
einrichten.
In der .htaccess-Datei ist dafür zu setzen:
<Files
seite-pdf-ansicht.pdf>
Header append Link „<http://www.domain.de/seite.html>;
rel=\“canonical\”"
</Files>
Canonical Tags für Google News gegen doppelte News-Platzierungen:
Wenn in Google News mehrere Versionen des gleichen Artikels erscheinen, kann
man Google anhand von "rel=canonical" mitteilen, welcher Artikel das
Original und welcher das Duplikat ist. Detaillierteres findet man hierzu in einen Google News Hilfe Artikel
Canonical Tags - Die lt. Google 5 häufigsten Fehler:
Google erklärt im offiziellen deutschen Webmaster-Zentrale-Blog die bei der
Verwendung von dem "rel=canonical" Tag auftretenden 5 häufigsten Fehler
Canonical Tag & Firefox:
Der Firefox-Browser zeigt mit der Firefox
Erweiterung "Search Status" am rechten Ende der Adresszeile die Verwendung von Canonical Tags an:
1.
2. 3.
1. Auf der Seite werden keine Canonical Tags verwendet. 2. Auf der Seite ist ein Canonical Tag gesetzt, der auf eine andere Seite
verweist. 3. Auf der Seite ist ein Canonical Tag gesetzt, der auf die
aktuelle Seite verweist.
(aktuelle Seite = Canonical Tag-Zielseite)