La balise canonical est une balise qui contient l’adresse HTML de la page originale, appelĂ©e « canonique ». Elle sert Ă  faire comprendre aux moteurs de recherche (Google, Bing ou Yahoo) qu’une page web est copiĂ©e ou contient un contenu identique Ă  celle-ci.

Définition de la balise canonique

La balise canonique, Ă©galement appelĂ©e balise canonical permet d’indiquer aux robots d’indexation, lors d’un crawl, quelle est l’URL source. Cette balise permet ainsi d’Ă©viter ce qu’on appelle en SEO les doublons. La balise canonical s’Ă©crit de la manière suivante : – link rel=“canonical” href=“https://www.pagesource desite.com/” -. Cet attribut « rel=canonical » doit ĂŞtre ajoutĂ© dans le code -head- sur chaque page oĂą une version dupliquĂ©e apparaĂ®t. La page originale doit comporter une URL canonique, qui renvoie cette fois vers elle-mĂŞme.

Comment gérer le contenu dupliqué ou les doublons ?

Le contenu dupliquĂ© ou les doublons peuvent ĂŞtre Ă©vitĂ©s grâce Ă  la balise canonical. En effet, c’est cette balise qui indique, dans la page dupliquĂ©e, quelle est la page source ou originale. La balise canonique permet d’expliquer aux robots de Google qui est l’original et qui est la copie. Plus simplement, chaque page qui est en doublon doit possĂ©der dans son code source la page canonique dont elle est la copie. La balise canonical est informative. Google et ses algorithmes dĂ©cident ou non de la lire. Pour savoir quelle URL le moteur a prise en compte, il suffit de se rendre dans l’outil Google Search Console.

Ă€ retenir : le contenu dupliquĂ© est gĂ©rĂ© par la balise canonical qui indique dans la page dupliquĂ©e, l’URL de la page canonique dont elle est la copie conforme ou proche.

Les moteurs de recherche pénalisent-ils le contenu dupliqué ?

Non. Les moteurs de recherche ne pĂ©nalisent pas un site Ă  cause du contenu dupliquĂ© ou de l’absence de balises canoniques dans un site web. La pĂ©nalitĂ© est ailleurs. Elle s’exprime lors du budget crawl. Le risque est que Google (ou autre moteur) ne choisisse pas la balise canonique. Pour information, est considĂ©rĂ© comme contenu dupliquĂ© un texte ou un contenu avec une similitude proche de 70 %.

Exemple d’utilisation d’une balise canonical

Le fonctionnement de la balise canonical marche de la manière suivante. Si votre site d’e-commerce propose deux pages (A et B) dont le contenu est proche de plus de 70 %, alors vous devez indiquer Ă  Google quelle est la page originale. Si la page B reprend le contenu de la page A, il est prĂ©fĂ©rable d’insĂ©rer la balise suivante dans le header du code source de votre page B : – link rel=“canonical” href=“https://www.votrenomdesite.com/url-de-la-page-A/” -. La mĂŞme balise devra ĂŞtre introduite dans le fichier HTML de la page A. Ainsi, lors d’un crawl, les robots savent qui est l’URL originale et qui est la copie. Ces derniers considèrent le contenu de la page A comme le plus important. C’est cette page que les robots vont choisir d’indexer ou non.

Utilité de la balise canonical en SEO

L’utilitĂ© de la balise canonique en rĂ©fĂ©rencement naturel a fait ses preuves. Elle permet notamment de :

  • exclure les pages identiques lors d’une demande d’indexation ;
  • optimiser le budget crawl et d’Ă©viter le gaspillage en interne ;
  • diminuer les risques de pĂ©nalitĂ© si le contenu dupliquĂ© (duplicate content) est supĂ©rieur Ă  70 % (filtre Panda).

Actuellement, les moteurs de recherche priorisent la meilleure expĂ©rience utilisateur. Sans l’utilisation de balises canoniques, ce sont eux qui vont choisir Ă  votre place la version du contenu qu’ils estiment ĂŞtre la meilleure. Le pari est un peu risquĂ©. Dans le cas oĂą vous n’intervenez pas, votre positionnement dans les rĂ©sultats de recherche peut chuter, tout comme votre trafic. Pour finir, Google peut aussi prendre l’initiative de retirer certaines pages de son index.