La balise canonical est une balise qui contient l’adresse HTML de la page originale, appelée « canonique ». Elle sert à faire comprendre aux moteurs de recherche (Google, Bing ou Yahoo) qu’une page web est copiée ou contient un contenu identique à celle-ci.
Définition de la balise canonique
La balise canonique, également appelée balise canonical permet d’indiquer aux robots d’indexation, lors d’un crawl, quelle est l’URL source. Cette balise permet ainsi d’éviter ce qu’on appelle en SEO les doublons. La balise canonical s’écrit de la manière suivante : – link rel=“canonical” href=“https://www.pagesource desite.com/” -. Cet attribut « rel=canonical » doit être ajouté dans le code -head- sur chaque page où une version dupliquée apparaît. La page originale doit comporter une URL canonique, qui renvoie cette fois vers elle-même.
Comment gérer le contenu dupliqué ou les doublons ?
Le contenu dupliqué ou les doublons peuvent être évités grâce à la balise canonical. En effet, c’est cette balise qui indique, dans la page dupliquée, quelle est la page source ou originale. La balise canonique permet d’expliquer aux robots de Google qui est l’original et qui est la copie. Plus simplement, chaque page qui est en doublon doit posséder dans son code source la page canonique dont elle est la copie. La balise canonical est informative. Google et ses algorithmes décident ou non de la lire. Pour savoir quelle URL le moteur a prise en compte, il suffit de se rendre dans l’outil Google Search Console.
À retenir : le contenu dupliqué est géré par la balise canonical qui indique dans la page dupliquée, l’URL de la page canonique dont elle est la copie conforme ou proche.
Les moteurs de recherche pénalisent-ils le contenu dupliqué ?
Non. Les moteurs de recherche ne pénalisent pas un site à cause du contenu dupliqué ou de l’absence de balises canoniques dans un site web. La pénalité est ailleurs. Elle s’exprime lors du budget crawl. Le risque est que Google (ou autre moteur) ne choisisse pas la balise canonique. Pour information, est considéré comme contenu dupliqué un texte ou un contenu avec une similitude proche de 70 %.
Exemple d’utilisation d’une balise canonical
Le fonctionnement de la balise canonical marche de la manière suivante. Si votre site d’e-commerce propose deux pages (A et B) dont le contenu est proche de plus de 70 %, alors vous devez indiquer à Google quelle est la page originale. Si la page B reprend le contenu de la page A, il est préférable d’insérer la balise suivante dans le header du code source de votre page B : – link rel=“canonical” href=“https://www.votrenomdesite.com/url-de-la-page-A/” -. La même balise devra être introduite dans le fichier HTML de la page A. Ainsi, lors d’un crawl, les robots savent qui est l’URL originale et qui est la copie. Ces derniers considèrent le contenu de la page A comme le plus important. C’est cette page que les robots vont choisir d’indexer ou non.
Utilité de la balise canonical en SEO
L’utilité de la balise canonique en référencement naturel a fait ses preuves. Elle permet notamment de :
- exclure les pages identiques lors d’une demande d’indexation ;
- optimiser le budget crawl et d’éviter le gaspillage en interne ;
- diminuer les risques de pénalité si le contenu dupliqué (duplicate content) est supérieur à 70 % (filtre Panda).
Actuellement, les moteurs de recherche priorisent la meilleure expérience utilisateur. Sans l’utilisation de balises canoniques, ce sont eux qui vont choisir à votre place la version du contenu qu’ils estiment être la meilleure. Le pari est un peu risqué. Dans le cas où vous n’intervenez pas, votre positionnement dans les résultats de recherche peut chuter, tout comme votre trafic. Pour finir, Google peut aussi prendre l’initiative de retirer certaines pages de son index.