Un sitemap XML est un fichier structuré qui liste toutes les URLs importantes d'un site et fournit des métadonnées sur chacune. Il aide les moteurs de recherche à découvrir et indexer efficacement les pages, notamment pour les sites récents ou de grande taille.
Explication approfondie
Le sitemap XML est particulièrement utile pour les sites récents (peu de backlinks donc peu de chemins d’entrée pour les robots), les sites de grande taille (nombreuses pages à indexer), et les sites dont certaines pages sont mal reliées par le maillage interne.
Un bon sitemap ne doit contenir que les pages canoniques retournant un code 200 : pas de pages noindex, pas de pages en redirection, pas d’URLs avec paramètres non canoniques. Un sitemap propre est un signal de qualité technique. Pour les grands sites, on crée un sitemap index qui référence plusieurs sitemaps thématiques.
On soumet son sitemap dans Google Search Console et on peut l’indiquer dans le fichier robots.txt. Il est recommandé de le mettre à jour automatiquement à chaque publication ou modification, ce que font nativement la plupart des CMS et plugins SEO.
Un site d’actualités configure son sitemap news pour se mettre à jour en temps réel dès qu’un article est publié. Google découvre les nouveaux articles très rapidement après leur publication, ce qui est crucial pour les sujets d’actualité où le timing de l’indexation peut faire la différence entre capter le pic de trafic ou le rater.
Questions fréquentes
Non. Le sitemap est une liste de suggestions faites à Google, pas une garantie d'indexation. Google peut ignorer certaines URLs s'il les juge de faible qualité. Il accélère surtout la découverte des nouvelles pages.
Le sitemap XML est destiné aux robots des moteurs de recherche. Le sitemap HTML est une page destinée aux utilisateurs pour faciliter la navigation. En SEO, c'est le sitemap XML qui a de l'importance pour l'indexation.
Oui si vous souhaitez les voir indexées dans Google Images. Un sitemap image permet à Googlebot de découvrir des images qui ne seraient pas accessibles via le crawl normal des pages.
À explorer aussi
Des notions proches pour approfondir votre compréhension du SEO.
Mettons ce savoir en pratique pour votre site.