Brandaktuelles, neues SEO-Feature: Canonical-Link-Attribut

Die großen Suchmaschinen Google, Live und Yahoo! haben gestern das neue “canonical url tag” als Funktionalität angekündigt, mit dem sich selbst ersteller doppelter Content einfach SEO-gerecht kennzeichnen lässt.
Dies dürfte eine der wichtigsten Neuerungen im Bereich der Suchmaschinenoptimierung (SEO) in letzter Zeit sein.

Anwendungsbeispiel: Druckseiten

Wie funktioniert es?

Der Link-Tag wird in den Header eingebunden und sagt der Suchmaschinen, dass diese Seite eigentlich eine Duplicate Content der im Link-Tag angegebenen Seite ist.

<link rel="canonical" href="http://www.ideenkrieger.de/online-marketing">

Das ist einer 301-Weiterleitung recht ähnlich, mit folgenden Unterschieden:

  • Eine 301-Weiterleitung leitet den gesamten Traffic weiter (der Suchmaschine und der menschlichen Personen) - ein canonical-Link wirkt sich ausschließlich auf die Suchmaschinen aus
  • Eine 301-Weiterleitung ist nach wie vor ein wesentlich stärkeres Signal. Denn die Suchmaschinen werden sicherlich zusätzlich mit dem Mißbrauch bzw. mit flascher Anwendung des Tags umgehen müssen. Bei einer 301-Redirection ist das nicht der Fall.
  • Domainübergreifend Weiterleitungen sind mit einem Canonical-Link nicht möglich; da bleibt nach wie vor die 301-Redirection das bevorzugte Mittel.

Wann kann das Tag verwendet werden?

  1. Um der Suchmaschine zu sagen, welche der Seiten sie in den Index einbinden oder ausschließen soll.
  2. Um der Suchmaschine zu sagen, für welche Seite Sie die Ranking-Faktoren gelten lassen soll.
  3. Um der Suchmaschinen zu sagen, welche Seite im Such-Index (SERPs) angezeigt werden soll.

Zu guter letzt noch ein paar Zitate, der Suchmaschinen selbst:

Einige Kommentare von Google:

Is rel=”canonical” a hint or a directive?
It’s a hint that we honor strongly. We’ll take your preference into account, in conjunction with other signals, when calculating the most relevant page to display in search results.

Can I use a relative path to specify the canonical, such as <link rel=”canonical” href=”product.php?item=swedish-fish” />?
Yes, relative paths are recognized as expected with the <link> tag. Also, if you include a <base> link in your document, relative paths will resolve according to the base URL.

Is it okay if the canonical is not an exact duplicate of the content?
We allow slight differences, e.g., in the sort order of a table of products. We also recognize that we may crawl the canonical and the duplicate pages at different points in time, so we may occasionally see different versions of your content. All of that is okay with us.

What if the rel=”canonical” returns a 404?
We’ll continue to index your content and use a heuristic to find a canonical, but we recommend that you specify existent URLs as canonicals.

What if the rel=”canonical” hasn’t yet been indexed?
Like all public content on the web, we strive to discover and crawl a designated canonical URL quickly. As soon as we index it, we’ll immediately reconsider the rel=”canonical” hint.

Can rel=”canonical” be a redirect?
Yes, you can specify a URL that redirects as a canonical URL. Google will then process the redirect as usual and try to index it.

What if I have contradictory rel=”canonical” designations?
Our algorithm is lenient: We can follow canonical chains, but we strongly recommend that you update links to point to a single canonical page to ensure optimal canonicalization results.

von Yahoo!:

• The URL paths in the <link> tag can be absolute or relative, though we recommend using absolute paths to avoid any chance of errors.

• A <link> tag can only point to a canonical URL form within the same domain and not across domains. For example, a tag on http://test.example.com can point to a URL on http://www.example.com but not on http://yahoo.com or any other domain.

• The <link> tag will be treated similarly to a 301 redirect, in terms of transferring link references and other effects to the canonical form of the page.

• We will use the tag information as provided, but we’ll also use algorithmic mechanisms to avoid situations where we think the tag was not used as intended. For example, if the canonical form is non-existent, returns an error or a 404, or if the content on the source and target was substantially distinct and unique, the canonical link may be considered erroneous and deferred.

• The tag is transitive. That is, if URL A marks B as canonical, and B marks C as canonical, we’ll treat C as canonical for both A and B, though we will break infinite chains and other issues.

und von Live/MSN:

  • This tag will be interpreted as a hint by Live Search, not as a command. We’ll evaluate this in the context of all the other information we know about the website and try and make the best determination of the canonical URL. This will help us handle any potential implementation errors or abuse of this tag.
  • You can use relative or absolute URLs in the “href” attribute of the link tag.
  • The page and the URL in the “href” attribute must be on the same domain. For example, if the page is found on “http://mysite.com/default.aspx”, and the ”href” attribute in the link tag points to “http://mysite2.com”, the tag will be invalid and ignored.
    • However, the “href” attribute can point to a different subdomain. For example, if the page is found on “http://mysite.com/default.aspx” and the “href” attribute in the link tag points to “http://www.mysite.com”, the tag will be considered valid.
  • Live Search expects to implement support for this feature sometime in the near future.

Vielen Dank an Randfish von SEOmoz für diesen guten SEO-Artikel (Originalartikel auf englisch).

Eine Reaktion zu “Brandaktuelles, neues SEO-Feature: Canonical-Link-Attribut”

  1. Sven

    Nun gibt es das schon seit Februar 2009 und ich nehme dieses heue das erste mal wirklich wahr. Nun aber einmal meine Frage, was bringt es konkret. Ich habe jetzt eine Seite die ist sowohl über http://www.meine-seite.de, wie auch über meine-seite.de erreichbar. In diesen Tag gebe ich jetzt ein, dass http://www.meine-seite.de die richtige und meine-seite.de die ist, die nicht indexiert werden soll, oder wie muss ich das ganze verstehen? (ich hoffe das es meine-seite.de nicht gibt, soll nur als Beispiel dienen ;-) )