Paramètres par défaut

Options

À quoi sert un sitemap XML ?

Un sitemap XML est un fichier qui liste toutes les pages importantes de votre site et indique aux moteurs de recherche comment les explorer. Il ne garantit pas l'indexation, mais il facilite le travail du crawler, notamment sur les sites récents, peu liés en interne, ou qui ont beaucoup de pages.

BaliseObligatoireRôle
<loc>OuiURL complète de la page (avec https://)
<lastmod>NonDate de dernière modification (format YYYY-MM-DD)
<changefreq>NonFréquence estimée de mise à jour du contenu
<priority>NonPriorité relative entre pages (0.0 à 1.0)

Où déposer le sitemap et comment le déclarer ?

Placez le fichier sitemap.xml à la racine de votre site (monsite.fr/sitemap.xml). Déclarez-le ensuite dans votre fichier robots.txt avec la ligne Sitemap: https://monsite.fr/sitemap.xml, et soumettez-le manuellement dans Google Search Console via "Sitemaps".

Questions fréquentes

Toutes les pages doivent-elles figurer dans le sitemap ?

Non. Le sitemap ne doit contenir que les pages que vous souhaitez voir indexées. Excluez les pages noindex, les pages de confirmation de formulaire, les pages de politique de confidentialité si vous ne voulez pas les mettre en avant, les URLs avec paramètres qui créent du contenu dupliqué, et les pages d'administration. Un sitemap avec des pages de mauvaise qualité peut nuire plus qu'il n'aide.

Quelle est la limite de taille d'un sitemap ?

Un sitemap XML peut contenir au maximum 50 000 URLs et ne doit pas dépasser 50 Mo non compressé. Si votre site dépasse ces limites, découpez-le en plusieurs sitemaps et créez un sitemap index qui les référence tous. Pour la plupart des PME et sites de services, un seul sitemap suffit largement.

La priorité et la changefreq influencent-elles vraiment le crawl ?

Dans la pratique, Google déclare ignorer largement ces deux balises pour déterminer la fréquence de crawl. Il s'appuie sur ses propres signaux (popularité, liens entrants, fraîcheur du contenu). Ces balises restent utiles pour communiquer vos intentions, mais ne comptez pas dessus pour forcer un recrawl. La balise lastmod est en revanche plus prise en compte, surtout si vous la mettez à jour réellement lors de chaque modification de page.