Ce qu'est la balise canonical
La balise canonical est un élément HTML placé dans le <head> d'une page. Elle indique aux moteurs de recherche quelle URL est la version "officielle" d'un contenu donné. En termes techniques, on appelle ça signaler l'URL canonique.
Sa syntaxe est simple :
<link rel="canonical" href="https://monsite.com/ma-page/" />
Quand Google rencontre cette balise sur une page, il comprend que c'est l'URL indiquée qui doit être indexée et positionnée. Les éventuelles autres versions (avec paramètres, en HTTP, sans slash final…) sont ignorées pour le classement.
Canonical vs redirection 301 : quelle différence ?
La redirection 301 renvoie l'utilisateur et les robots vers une nouvelle URL. La balise canonical laisse les pages accessibles mais désigne laquelle doit compter en SEO. On utilise le canonical quand on veut garder les pages actives (pour l'expérience utilisateur ou les campagnes publicitaires) sans diluer l'autorité entre plusieurs versions.
Quand utiliser la balise canonical
La balise canonical n'est pas réservée aux cas extrêmes. Voici les situations concrètes où elle est utile, voire indispensable.
| Situation | Problème sans canonical | Solution |
|---|---|---|
| Paramètres d'URL (tracking, filtres, tri) | Google voit des dizaines de variantes de la même page | Canonical vers l'URL propre sans paramètre |
| Contenu syndicué (republié sur d'autres sites) | Le contenu original peut être déclassé au profit d'une copie | Le site qui republie pointe son canonical vers l'original |
| Versions HTTP et HTTPS coexistantes | Autorité divisée entre deux protocoles | Canonical vers la version HTTPS + redirection 301 |
| Pagination (/page/2/, /page/3/…) | Contenu partiel répété, signaux dilués | Canonical vers la page principale (si les sous-pages n'ont pas de valeur propre) |
| Fiches produit avec variantes (taille, couleur) | Plusieurs URLs quasi-identiques | Canonical vers la fiche principale |
Les erreurs courantes avec le canonical
La balise canonical est facile à mal implémenter. Ces erreurs reviennent régulièrement dans mes audits.
-
Le canonical pointe vers la mauvaise URL
Sur certains CMS, une mauvaise configuration génère des canonicals qui pointent vers la page d'accueil ou vers elles-mêmes mais avec une URL incorrecte. Résultat : Google ignore le signal ou le considère comme incohérent.
-
Canonical en conflit avec une redirection
Si la page A a un canonical vers B, mais que B redirige vers C, Google ne sait pas quoi indexer. Les signaux doivent être cohérents et alignés.
-
Chaîne de canonicals
A pointe vers B qui pointe vers C. Google ne suit généralement pas plus d'un niveau. Le canonical doit pointer directement vers la version finale.
-
Canonical absent sur les pages à paramètres
Un site e-commerce sans canonical sur ses pages filtrées peut générer des centaines d'URLs dupliquées que Google explore inutilement, consommant le budget de crawl.
Le canonical externe : republier sans risque
Le canonical peut aussi pointer vers un autre domaine. C'est la clé pour republier du contenu sur des plateformes tierces (Medium, LinkedIn Articles, presse spécialisée) sans risquer de pénalité pour duplicate content.
Si un magazine en ligne publie l'un de mes articles, il peut insérer dans son code un canonical qui pointe vers l'URL originale sur mon site. Résultat : il garde la page accessible pour ses lecteurs, mais Google sait que la version de référence est la mienne.
Le canonical est un signal, pas une directive. Google peut choisir de l'ignorer s'il juge que l'URL indiquée n'est pas la meilleure version. En pratique, il suit le canonical dans la très grande majorité des cas, mais des incohérences dans la structure du site peuvent le conduire à passer outre.