Qu’est-ce que Sitemap ?
Pour proposer des pages de recherche pertinentes, les moteurs de recherche utilisent des robots d’indexation, appelés aussi crawlers, qui explorent les sites internet et suivent les différents liens présents sur les pages. Le nombre de sites internet grandissant exponentiellement a demandé des ressources de plus en plus importantes. En 2006, pour rendre ce travail d’indexation moins fastidieux et plus efficace, un protocole standard du web a été créé par les trois grandes sociétés du web de l’époque qu’étaient Microsoft, Google et Yahoo : le protocole Sitemap. Composé de balises XML, il sert de plan de site aux moteurs de recherche.
Qu’est-ce qu’un fichier sitemap XML ?
Sitemap signifie plan de site en français et c’est exactement ce qu’un fichier sitemap est : le plan d’un site internet, généralement au format XML (pour Extensible Markup Language), encodé en UTF-8. On trouve à l’intérieur la liste des différentes URL du site. C’est une sorte de sommaire. Pour chaque URL on trouve plusieurs métadonnées comme la date de création ou de mise à jour, la place de l’URL par rapport aux autres URL du site, l’existence d’autres versions de l’URL créées dans d’autres langues et la fréquence de modification du contenu. On le trouve habituellement à l’adresse www.monsite.com/sitemap.xml. Il peut aussi lister les différents sitemaps du site, puisqu’un site ne contient pas forcément un seul fichier d’indexation. On peut par exemple avoir un sitemap pour les catégories, un pour les pages, un pour les articles de blog et un pour les tags, tous reliés à un fichier parent. Le fichier sitemap doit commencer par une balise ouvrante -urlset- et terminer par une balise fermante -/urlset-. Il doit spécifier l’espace de noms (protocole standard) dans la balise -urlset- et inclure une entrée -url- pour chaque URL, en tant que balise XML parente. Les balises enfants s’ouvrent sur -loc-.
Quel est le rôle d’un fichier sitemap ?
Le but d’un fichier sitemap XML est d’aider les robots des moteurs de recherche à parcourir un site internet plus facilement, notamment lorsque des changements sont opérés sur le site. Il fournit aussi plusieurs informations importantes comme la fréquence de modification d’une page. Cela aide les robots à savoir quand se rendre sur une URL. Une URL modifiée une fois par an n’a pas besoin d’être explorée de manière quotidienne, alors qu’une page de blog sera probablement modifiée au moins chaque semaine. Un fichier Sitemap XML ne garantit pas pour autant l’exploration et l’indexation d’un site internet plus rapidement, il ne fait que soumettre aux moteurs de recherche des informations et en facilite le travail. Il permet toutefois d’augmenter ses chances, en particulier si la navigation ou la stratégie générale de liens internes ne renvoient pas à toutes les pages du site. Par contre il n’influence pas la position d’une page ou d’un site sur une SERP.
Comment créer un fichier sitemap XML ?
S’il est possible de créer un fichier sitemap XML manuellement, il est beaucoup plus simple de le faire automatiquement. La majorité des CMS possèdent une fonction de création de sitemap, tout comme des plugins, notamment Yoast SEO sur WordPress. Un sitemap doit être encodé dans un format standard comme XML, Texte ou RSS et ne pas dépasser 50 Mo.
Comment fournir un fichier sitemap à Google ?
Les robots d’indexation ne trouvent pas le fichier sitemap XML tout seul. Son adresse doit être transmise aux moteurs de recherche. Pour fournir votre sitemap à Google, il faut se rendre dans la Google Search Console. Cliquez sur votre nom de domaine puis choisissez Index et Sitemaps. Dans le champ à remplir, tapez le nom du fichier, généralement sitemap.xml. Cliquez sur Envoyer et c’est fini !