Aller au contenu
indexurl.fr

// guide pilier

Balise canonical : éviter le contenu dupliqué.

Comment rel=canonical consolide les signaux d\'indexation sur une URL unique. Self-referencing, cohabitation avec hreflang, pagination, conflits avec noindex et erreurs courantes à éviter.

Par Léa Vasseur Lecture 13 min

// sommaire (9 sections)

À quoi sert rel=canonical.

La balise <link rel="canonical" href="..." /> indique à Google quelle URL doit être traitée comme la version principale lorsqu\'un même contenu (ou un contenu très similaire) est accessible via plusieurs URLs. Sans cette indication, Google choisit lui-même une canonique parmi les variantes, parfois la mauvaise, et fragmente les signaux SEO entre les doublons. Pour le contexte global, voir le guide indexation Google.

// à retenir

Google choisit toujours UNE URL canonique, qu\'on lui dise ou non. La balise canonical est un signal fort, pas une directive absolue : Google peut l\'ignorer si d\'autres signaux pointent ailleurs (backlinks, sitemap, redirections).

Ce que canonical consolide

  • Le PageRank et l\'autorité des backlinks pointant vers les variantes sont attribués à la canonique.
  • Les signaux d\'engagement (clics SERP, temps de session) sont consolidés sur l\'URL canonique.
  • L\'index Google ne conserve qu\'une seule version, ce qui évite la cannibalisation entre URLs identiques.
  • Le crawl budget est préservé : Google sait qu\'il peut espacer le crawl des variantes non canoniques.

Self-referencing canonical.

Chaque page indexable doit pointer vers elle-même via canonical. C\'est le pattern par défaut, à appliquer même quand aucune duplication n\'est connue.

  1. 01

    Protection contre les paramètres URL imprévus

    Sans canonical explicite, une URL partagée avec ?utm_source=newsletter, ?fbclid=xyz ou un identifiant de session peut être indexée à la place de l\'URL propre. Le self-referencing supprime cette ambiguïté en permanence.

  2. 02

    Format strict

    URL absolue avec protocole, sans paramètres ni fragment, dans la version finale (HTTPS, avec ou sans www selon le choix du domaine). Exemple : <link rel="canonical" href="https://exemple.com/guides/canonical" />.

  3. 03

    Génération automatique

    Tous les CMS modernes (WordPress + Yoast/Rank Math, Astro, Next.js, Shopify) génèrent un canonical self-referencing par défaut. Vérifier dans le HTML rendu, pas dans le code source du template, pour s\'assurer qu\'aucun plugin ne l\'écrase.

Contenu dupliqué interne.

Quatre cas typiques de duplication interne où canonical doit pointer vers la version principale, jamais vers le doublon.

Paramètres de tri et filtres

?sort=price-asc, ?color=red, ?page=2. Si les variantes ne créent pas de contenu réellement différent, canonical vers la page sans paramètres.

e-commerce, listings

Versions imprimables et AMP

/article/?print=1 ou /amp/article/. Toutes les variantes d\'affichage doivent pointer leur canonical vers la version HTML standard.

médias, blogs

URLs avec et sans trailing slash

/guides/canonical et /guides/canonical/ sont deux URLs distinctes pour Google. Choisir une convention, faire 301 vers cette version, et canonical pointant vers elle.

tous les sites

Mobile et desktop séparés

Architecture obsolète m.exemple.com. La version mobile pointe son canonical vers la version desktop, qui pointe vers elle-même. À migrer vers responsive (cf. mobile-first indexing).

sites legacy

Cohabitation avec hreflang.

Sur un site multilingue, canonical et hreflang doivent travailler ensemble sans se contredire. Règle absolue : le canonical d\'une page pointe toujours vers une URL dans la même langue.

Configuration recommandée

La page française /fr/article a un canonical self-referencing vers /fr/article. La page anglaise /en/article a un canonical vers /en/article. Les hreflang lient les deux versions entre elles, sans interférer avec le canonical.

L\'erreur à éviter

Faire pointer toutes les versions linguistiques vers la version anglaise (ou française) "principale" via canonical. Conséquence : Google désindexe toutes les versions traduites, considérées comme des doublons. Les hreflang sont alors ignorés. Le trafic international s\'effondre.

// règle d'or

Canonical et hreflang ont des rôles distincts. Canonical traite la duplication intra-langue. Hreflang traite la cible géographique et linguistique. Jamais de canonical cross-language sur un site multilingue.

Pagination.

Depuis 2019, Google a abandonné le support de rel="prev" et rel="next". La nouvelle règle : chaque page paginée doit avoir son propre canonical self-referencing.

OK Self-referencing par page

/blog/page/2/ a un canonical vers /blog/page/2/. Chaque page est indexable indépendamment, ses items sont découverts et crawlés normalement.

KO Tout pointer vers la page 1

/blog/page/2/ pointant son canonical vers /blog/. Google traite alors les pages 2, 3, 4 comme des doublons de la page 1, et perd l\'indexation des items en profondeur.

!? Page "view all"

Si une page /blog/all/ liste l\'intégralité du contenu, on peut faire pointer les pages paginées vers elle. Approche valide mais peu utilisée : la page all/ devient lourde et lente à charger.

Conflits avec noindex.

Combiner canonical et noindex sur la même page envoie un signal contradictoire à Google. Trois scénarios à comprendre pour les éviter.

  1. 01

    Page A noindex avec canonical vers page B

    Signal contradictoire : "consolide les signaux sur B" et simultanément "exclus A de l\'index". Google peut traiter le noindex comme s\'appliquant aussi à B, ou ignorer le canonical. Résultat imprévisible. Choisir un seul mécanisme : noindex sur A sans canonical, ou canonical de A vers B sans noindex.

  2. 02

    Canonical vers une page noindex

    La page A pointe son canonical vers la page B, mais B est en noindex. Google doit consolider sur une page exclue de l\'index. Conséquence courante : A est aussi désindexée. Vérifier que toute cible de canonical est indexable : status 200, pas de noindex, pas de robots.txt bloquant, pas de redirection. Pour diagnostiquer, voir les 7 statuts d'exclusion GSC.

  3. 03

    Cas légitime : page filtre interne

    Une page de résultats filtrés que l\'on ne veut ni indexer ni voir cannibaliser le listing principal : noindex seul, sans canonical. Google exclut la page de l\'index sans transférer de signaux ailleurs.

3 méthodes pour déclarer canonical.

Trois manières techniques de déclarer une URL canonique. Force du signal et cas d\'usage différents pour chacune.

Balise <link> HTML

<link rel="canonical" href="https://exemple.com/page" /> dans le <head>. Méthode standard, supportée par tous les CMS et tous les moteurs. À utiliser par défaut sur toute page HTML.

95 % des cas

Header HTTP Link

Link: <https://exemple.com/doc.pdf>; rel="canonical". Indispensable pour les fichiers non-HTML : PDF, images, vidéos, JSON. Configuration côté serveur (Apache, Nginx, CDN).

PDF, médias

Sitemap XML

Lister uniquement les URLs canoniques dans le sitemap. Signal faible : Google le considère comme une suggestion, pas comme une déclaration. Ne remplace jamais la balise <link>, vient en complément.

renforcement

Règle de cohérence

Si plusieurs méthodes coexistent (HTML + HTTP + sitemap), elles doivent pointer vers la même URL canonique. Toute divergence dilue le signal et pousse Google à choisir lui-même, parfois mal.

6 erreurs courantes.

Six erreurs récurrentes détectées en audit, classées par fréquence. Chacune corrigeable en quelques heures de dev.

01 Canonical relatif au lieu d\'absolu

href="/page" au lieu de href="https://exemple.com/page". Interprétation ambiguë selon le crawler, conflits HTTP/HTTPS, divergence rendu serveur vs navigateur. Toujours absolu, sans exception.

02 Canonical vers une URL en redirection

La cible du canonical est en 301 ou 302 vers une autre URL. Google doit suivre la chaîne, dilue le signal et peut finir par choisir une autre canonique. Cible d\'un canonical : toujours une URL servie en 200 directement.

03 Canonical vers une page noindex

Signal contradictoire majeur. Google peut désindexer aussi les pages sources. Vérifier régulièrement via crawl que toute cible de canonical est indexable.

04 Canonical différent entre HTML et header HTTP

La balise <link> pointe vers une URL, le header HTTP Link vers une autre. Google reçoit deux instructions, en choisit une au hasard. Auditer régulièrement les headers (curl, Screaming Frog) pour détecter les divergences.

05 Canonical cross-domain non voulu

Sur un site nouvellement migré ou une copie de staging, le canonical pointe encore vers l\'ancien domaine ou vers le domaine de prod depuis la pré-prod. Google désindexe le site visible. Toujours vérifier les canonicals après une migration ou un déploiement.

06 Oublier le self-referencing

Aucun canonical sur la page : Google détermine la canonique seul, vulnérable aux paramètres URL parasites. Plugin SEO mal configuré ou template custom oublié : auditer un échantillon de templates pour valider la présence systématique.

Questions fréquentes.

Canonical vs noindex vs 301 : lequel choisir ?

Trois outils, trois objectifs. 301 : la page A est définitivement remplacée par la page B, A disparaît de l'index. noindex : la page existe pour les utilisateurs mais doit être exclue de l'index Google. canonical : plusieurs URLs servent un contenu identique ou très proche, Google doit consolider les signaux sur une seule. Règle simple : si la page A n'a plus de raison d'exister, faire un 301. Si elle doit rester accessible mais pas indexée, noindex. Si elle est une variante (paramètre, tri, version imprimable), canonical vers la version principale.

Faut-il un canonical sur toutes les pages, même celles uniques ?

Oui. Le self-referencing canonical est recommandé sur toute page indexable, même si aucune duplication n'est connue. Raison : protéger contre les paramètres URL imprévus (UTM, sessions, tracking, partage social) qui peuvent créer des doublons accidentels. Sans canonical explicite, Google peut indexer ?utm_source=newsletter à la place de l'URL propre. Coût d'implémentation : nul (générée automatiquement par tous les CMS modernes). Bénéfice : robustesse de l'indexation.

Canonical fonctionne-t-il entre domaines différents ?

Oui, le canonical cross-domain est supporté par Google depuis 2009. Cas typique : republication d'un article sur un site partenaire ou un agrégateur, le canonical du site partenaire pointe vers l'original. Google consolide les signaux SEO vers la version originale. Attention : Google peut ignorer un canonical cross-domain si les signaux contradictoires sont trop forts (backlinks massifs vers la copie, contenu sensiblement différent). Pour une syndication propre, contrôler aussi les balises Open Graph et le maillage interne.

Google ignore-t-il parfois mon canonical ?

Oui, fréquemment. Le canonical est un signal fort, pas une directive absolue. Google peut choisir une URL canonique différente s'il détecte des signaux contradictoires : contenu très différent entre les deux URLs, backlinks pointant majoritairement vers la non-canonique, sitemap qui liste la non-canonique, redirection 301 dans le mauvais sens. Vérifier la canonique réellement choisie par Google via Search Console > Inspection de l'URL > "URL canonique sélectionnée par Google".

Comment vérifier le canonical reconnu par Google ?

Search Console > Inspection de l'URL > coller l'URL > section "Indexation" > comparer "URL canonique déclarée par l'utilisateur" et "URL canonique sélectionnée par Google". Si les deux diffèrent, Google a choisi une autre URL canonique que celle déclarée. Causes typiques : signaux contradictoires (sitemap, backlinks, hreflang), contenu jugé trop différent, redirection ou autre canonical en cascade. Investiguer avant de modifier la balise. Voir le guide Search Console pour le détail de l'outil.

Pagination : faut-il canonical vers la page 1 ?

Non, plus depuis 2019. Google a abandonné le support de rel="prev"/"next" et recommande désormais que chaque page de la série ait son propre canonical self-referencing. /page/2/ a un canonical vers /page/2/, /page/3/ vers /page/3/. Cela permet à Google d'explorer et d'indexer le contenu (souvent unique) de chaque page paginée. Pointer toutes les pages vers la page 1 reviendrait à dire à Google que les pages 2, 3, 4 n'existent pas, et perdre l'indexation des items en profondeur.

Canonical absolu ou relatif ?

Toujours absolu, avec protocole inclus : https://exemple.com/page. Un canonical relatif (/page) est techniquement valide selon les specs HTML, mais déclenche régulièrement des bugs : interprétation ambiguë lors d'un crawl, conflits avec les versions HTTP/HTTPS, divergence entre rendu serveur et rendu navigateur. Coût d'écrire l'URL absolue : nul. Risque évité : majeur. Règle sans exception.

Mon canonical pointe vers une page noindex, problème ?

Oui, problème majeur. Signal contradictoire : on demande à Google de consolider les signaux sur la page X, mais cette page X est marquée comme à exclure de l'index. Résultat possible : Google désindexe également les pages qui pointent vers elle, ou choisit une autre canonique de manière imprévisible. Règle stricte : la cible d'un canonical doit être une page indexable (status 200, pas de noindex, pas de robots.txt bloquant, pas de redirection). Vérifier régulièrement via crawl (Screaming Frog, Sitebulb).

// passer à l\'action

Diagnostiquer une URL.

Vérifier en 10 secondes que le canonical d\'une page est correctement déclaré, absolu, et pointe vers une URL indexable. Diagnostic gratuit, 17 contrôles techniques.