dinsdag 7 augustus 2018

De canonical-tag 1/3: De theorie

Waarom een canonical-tag?

Google houdt niet van gedupliceerde content, of die nu op verschillende websites staat of op dezelfde. Maar soms is gedupliceerde content niet te vermijden, bijvoorbeeld als je twee versies van je website hebt, eentje voor mobiele apparaten en eentje voor computers met een groot scherm. Of als je in je webshop telefoonhoesjes in talrijke kleurvariaties verkoopt voor dezelfde smartphone, waarbij behalve de kleur alle andere specificaties en verdere info hetzelfde zijn.

Speciaal daarvoor is de canonical-tag ontwikkeld. Daarmee zeg je tegen Google: "Dit is een dubbele pagina. Referenceer niet deze pagina zelf, maar wel de pagina waarvan de url in de canonical-tag staat en neem die laatste op in de zoekresultaten."

In de html-code van de pagina met gedupliceerde content met url https://www.jewebsite.com/gedupliceerde-pagina.html/ staat dan bijvoorbeeld: <link rel="canonical" href="https://www.jewebsite.com/orginele-pagina.html/" />

De canonical-tag volgens Yoast (in het Engels)

Let op bij het instellen van de canonical-tag


Er kunnen ook andere problemen optreden met canonical-tags:
  • Je maakt een tikfout in de url van de canonical-tag, waardoor je Google per ongeluk doorverwijst naar een onbestaande pagina. Raar maar waar, dat gebeurt bij 2 % van de webpagina’s met canonical-tags.
  • Je kunt Google onbedoeld in een rondje laten draaien als op webpagina A een canonical-tag staat die verwijst naar webpagina B, op webpagina B een canonical-tag die verwijst naar webpagina C en op die laatste een canonical-tag die verwijst naar webpagina A. Die situatie is goed voor 5,3 % van pagina’s met canonical-tags.

Bovendien kun je in theorie de canonical-tag in theorie op oneigenlijke wijze inzetten, als je bijvoorbeeld wilt voorkomen dat Google bepaalde webpagina’s referenceert, ook al hebben die geen gedupliceerde content (1). Dan zou je de zoekmachine via de canonical-tag naar een pagina kunnen sturen die je wel wilt zien verschijnen in de zoekresultaten. In theorie zou je via de canonical-tag Google zelfs naar een andere website kunnen doorverwijzen (2). De goede raad hier is: doe dat liever niet, gebruik de canonical-tag alleen waar die voor bedoeld is. In het geval van (1) is de noindex-instructie een betere oplossing, bij (2) een gewone redirect.

De canonical-tag is een relatief nieuw gegeven, maar toch: het valt op hoe vaak die fouten bevat. Dat is niet zo vreemd, omdat die canonical-tag zo goed als onzichtbaar is voor gewone internetgebruiker en zelfs voor webmasters. Het lijkt erop dat Google die fouten meestal doorziet, maar evengoed: je moet niet willen dat Google ook maar het idee krijgt dat er wat scheelt aan de structuur van je website.

Soms maakt je CMS de canonical-tag verplicht

Sommige CMS (content management systems) voorzien op iedere webpagina verplicht een canonical-tag. Als het om een originele, niet-gedupliceerde pagina gaat, moet daar de exacte url van de pagina zelf staan, volgens de standaardprocedure. En daar kan het wel eens fout gaan. Enkel voorbeelden:
  • Stel dat je begonnen bent met je homepage en via je CMS die pagina steeds gekopieerd hebt om de onderliggende pagina’s met content te vullen, en je hebt vergeten de canonical-tag van die onderliggende pagina’s aan te passen (als je CMS dat niet automatisch doet) – daar staat door het kopiëren de url van je homepage in – dan referenceert Google in theorie alleen maar je homepage.
  • Gebruik in de canonical-tag de 'echte' url van de pagina, met het correcte protocol (http: of https:), alle tekens, ook de laatste ‘\’, met of zonder ‘www.’. Browsers – en servers – linken automatisch door van die verschillende ‘versies’ van een url naar de correcte, en Google zal dergelijke foutjes ook wel doorzien. Maar het lijkt of je Google in een kringetje probeert te sturen, van pagina A naar pagina B, die dan weer automatisch doorlinkt naar pagina A, enz.

Wat doet Google écht met de canonical-tag?

Dus, via de canonical-tag zou je invloed kunnen uitoefenen op hoe Google je website referenceert. Via de url in die tag zeg je aan de zoekmachine welke in een reeks van vergelijkbare webpagina’s de originele is. Dat is de theorie, tenminste. Maar hoe gaat Google in werkelijkheid om met de canonical-tag? Bekijk hier de resultaten van een uitgebreid onderzoek.

Spoiler: Google doet met de canonical-tag wat Google zelf wil, blijkt uit praktijkvoorbeelden.

Geen opmerkingen:

Een reactie posten

De canonical-tag 1/3: De theorie

Waarom een canonical-tag? Google houdt niet van gedupliceerde content, of die nu op verschillende websites staat of op dezelfde. Maar so...