Sitemap XML

Sitemap XML

Définition

Un sitemap XML (plan de site XML) est un fichier qui liste les URL importantes d’un site avec des métadonnées (date de dernière modification, fréquence de mise à jour, priorité). Il aide les moteurs de recherche à découvrir et hiérarchiser le contenu pour l’indexation.

Pourquoi c’est utile

  • Accélérer la découverte des nouvelles pages
  • Signaler les mises à jour aux moteurs
  • Optimiser le budget de crawl sur les sites volumineux
  • Couvrir les contenus mal liés en interne (par défaut de maillage interne)

Bonnes pratiques

  • Lister uniquement les URL canoniques (voir balise canonique) en code 200
  • Ne pas inclure les pages en noindex ou bloquées par robots.txt
  • Maintenir un fichier propre, compressé en .gz si plus de 50 000 URL ou 50 Mo
  • Le déclarer dans le robots.txt et dans Search Console
  • Pour les sites multilingues, utiliser les attributs hreflang directement dans le sitemap