Sitemap XML
Un sitemap XML est un fichier qui liste toutes les URLs d'un site web pour faciliter le crawl par Google. Il indique la priorité, la fréquence de mise à jour et la date de dernière modification de chaque page. Obligatoire pour les sites > 50 pages.
Sitemap XML : définition complète
Le sitemap XML se place à la racine du site (votresite.fr/sitemap.xml) et se soumet à Google via Search Console > Sitemaps. Il supporte jusqu'à 50 000 URLs par fichier. Au-delà, utilisez un sitemap index qui référence plusieurs fichiers sitemap.
- Limite par fichier : 50 000 URLs ou 50 mo non compressé — à surveiller sur les sites programmatiques de grande taille.
- Après soumission d'un sitemap dans Search Console, Google commence à crawler les nouvelles URLs en moyenne dans les 24 h (Google Documentation 2024).
- Taux d'indexation moyen : 95 % des URLs d'un sitemap soumis sont indexées en moins de 30 jours si le contenu est jugé de qualité (Google 2024).
- Sites sans sitemap soumis : 18 % plus de pages en statut "Discovered, not indexed" par rapport aux sites avec sitemap actif (Ahrefs Crawl Study 2025).
- Format
lastmodrecommandé par Google : date ISO 8601 (2026-05-19) — les données de priorité et de fréquence sont ignorées dans 90 % des cas. - Notre sitemap Next.js généré dynamiquement couvre 1 665 URLs — construit en moins de 1 min au build.
Les CMS (WordPress, Next.js) génèrent le sitemap automatiquement. En Next.js, il se configure dans src/app/sitemap.ts. Un sitemap à jour est l'un des signaux les plus simples à activer pour améliorer la couverture d'index.
Exemple concret
Notre sitemap contient 1 665 URLs organisées par type (services, blog, outils, pages locales, pages secteur). Soumis à Search Console, 100 % indexé.
Concepts associés
Crawl
Le crawl est le processus par lequel les robots de Google (Googlebot) parcourent les pages d'un site web en suivant les liens.
SEOIndexation
L'indexation est le processus par lequel Google ajoute une page web à sa base de données (index).
SEOSEO
Le SEO (Search Engine Optimization) désigne l'ensemble des techniques d'optimisation d'un site web pour améliorer sa visibilité dans les résultats organiques des moteurs de recherche comme Google.
SEOrobots.txt
Le fichier robots.
AnalyticsGoogle Search Console
Google Search Console (GSC) est l'outil gratuit de Google pour surveiller et optimiser la présence d'un site dans les résultats de recherche.
Besoin d’aide pour votre stratégie digitale ?
Audit SEO offert. Recommandations sous 48h. Zéro engagement.