Sommaire
Pour optimiser la visibilité de votre site web sur les moteurs de recherche, vous devez dans l’idéal associer chaque page indexable à une intention de recherche qui se décline en une ou plusieurs expressions. Or, des raisons diverses peuvent mener à la création de pages en double, présentant un contenu identique ou très similaire. L’ajout d’une balise <link rel=”canonical” > permet de préciser aux moteurs de recherche, Google en tête, l’URL que vous désirez positionner sur la page de résultats. Cette balise est tout simplement indispensable pour votre référencement naturel !
Qu’est-ce que la canonicalisation d’URL en SEO ?
Le terme canonique est utilisé dans plusieurs domaines :
- En mathématiques, il désigne un élément classiquement choisi parmi un ensemble d’éléments aux propriétés analogues ;
- Dans la religion chrétienne, un évangile canonique est reconnu officiellement par les Églises chrétiennes.
Le terme canonique possède le même sens en SEO : une URL est dite canonique lorsqu’elle est officiellement reconnue et choisie par l’éditeur du site parmi une liste d’URL aux contenus analogues.
La canonicalisation d’URL consiste à préciser aux moteurs de recherche l’URL vous souhaitez positionner sur la page de résultats parmi une liste de pages web aux contenus identiques ou très similaires.
Chaque page de votre site peut spécifier au maximum une seule URL canonique :
- Identique à son URL (self-canonical) ;
- Ou différente, qui indique une autre page avec un contenu identique ou similaire.
La balise <link rel=”canonical”>
L’utilisation d’une balise <link rel=”canonical”> est la solution la plus simple pour spécifier une URL canonique.
Vous devez simplement ajouter dans le code source de votre page web, entre les balises <head></head>, la balise <link href=”https://www.monsite.com/mon-url-canonique.html” rel=”canonical” >. Deux cas de figure peuvent se présenter :
- La page web est l’URL canonique : vous reprenez la même URL
- La page web n’est pas l’URL canonique : vous précisez l’URL canonique.
Exemples d’utilisations de la balise <link rel=”canonical”>
Les pages https://www.monsite.com/mapage.html et https://www.monsite.com/mapagebis.html possèdent un contenu similaire, et l’URL canonique est https://www.monsite.com/mapage.html.
- https://www.monsite.com/mapage.html accueille une balise self-canonical <link href=”https://www.monsite.com/mapage.html” rel=”canonical”> ;
- https://www.monsite.com/mapagebis.html accueille une balise <link href=”https://www.monsite.com/mapage.html” rel=”canonical”> qui précise aux moteurs de recherche qu’il existe une autre page avec un contenu similaire choisie comme URL canonique.
La balise <link rel=”canonical”> est la solution la plus facile à déployer, et de nombreuses plateformes et logiciels de création de sites comme WordPress ou Prestashop proposent des solutions de gestion natives ou accessibles avec des extensions gratuites.
L’en-tête HTTP rel=”canonical”
L’entête HTTP est une solution intéressante si vous pouvez modifier la configuration de votre serveur. Le grand avantage par rapport à la balise est la possibilité d’indiquer une URL canonique pour un document autre qu’une page web (un fichier Docx ou PDF par exemple).
Exemple d’utilisation de l’en-tête HTTP <link rel=”canonical”>
Le serveur renvoie l’en-tête HTTP suivante pour l’URL https://www.monsite.com/mapage.html.
HTTP/1.1 200 OK
Content-Length: 19
…
Link: <https://www.monsite.com/mapage.html>; rel=”canonical”
…
Le fichier sitemap
Si une page est en double, Google vous recommande de n’ajouter que l’URL canonique dans votre fichier sitemap.
Notez toutefois que l’inclusion de sitemaps demeure un “signal faible permettant aux URL incluses dans un sitemap de devenir canoniques”
. Il ne remplacera pas la balise ou l’en-tête HTTP canonical.
Quand devez-vous spécifier une URL canonique ?
De nombreuses raisons peuvent contribuer à créer des pages en doublons ou des pages aux contenus très similaires sur votre site web.
Corriger des duplications dues à la réécriture des URL
Votre site web utilise certainement des solutions de réécriture pour avoir des URL propres. C’est ce que vous propose par exemple WordPress avec la gestion des permaliens :
- Sans réécriture : https://www.benjaminthiers.net/?p=123
- Avec réécriture : https://www.benjaminthiers.net/mon-slug-personnalise/
Parfois, les règles de réécriture peuvent créer une duplication involontaire de certaines pages. L’utilisation d’une URL canonique (canonical tag en anglais) est une solution SEO performante pour éviter une cannibalisation entre plusieurs contenus.
Cas n°1 : URL avec et sans slash à la fin
Selon la configuration de votre serveur, il est possible que les deux versions de vos URL affichent le même contenu. Par exemple :
- https://www.benjaminthiers.net/boite-a-outils/exploration-indexation-seo/
- https://www.benjaminthiers.net/boite-a-outils/exploration-indexation-seo
Si vous souhaitez que la version se terminant par un slash soit votre URL canonique, vous devez ajouter la balise canonical <link href=”https://www.monsite.com/mapage.html” rel=”canonical”> (ou utiliser l’en-tête HTTP équivalente) sur les deux pages concernées (avec et sans slash).
Cas n°2 : code source défini par l’ID et pas par le slug
Certains sites web construisent leurs URL sur le schéma https://www.monsite.com/mon-slug-personnalisé-12345.html. Le même code source s’affiche sans tenir compte du slug :
- https://www.monsite.com/mon-slug-personnalisé-12345.html
- https://www.monsite.com/mon-autre-slug-personnalisé-12345.html
- https://www.monsite.com/blablabla-12345.html
- Etc.
Si vous souhaitez avertir Google et les autres moteurs de recherche que https://www.monsite.com/mon-slug-personnalisé-12345.html est votre URL canonique, toutes les versions qu’importe le slug doivent indiquer la même balise ou entête HTTP canonical : <link href=”https://www.monsite.com/mon-slug-personnalisé-12345.html” rel=”canonical”>.
Gérer les filtres ou les options de tris des pages de listings
Certains sites médias, blogs ou boutiques en ligne génèrent des URL pour chaque filtrage ou tri de produits ou d’articles. Vous devez éviter que toutes ces pages soient ouvertes à l’indexation et viennent polluer votre crawl ou créer une cannibalisation dommageable.
Cas n°3 : Speedway.fr
Sur la boutique en ligne d’accessoires et équipements moto Speedway, les filtres et les tris apparaissent dans les URL :
- URL de la catégorie par défaut : https://www.speedway.fr/2304-blouson-moto
- Filtre sur une marque : https://www.speedway.fr/2304-blouson-moto?filters=21_457&no_permalink=1
- Filtre sur deux marques : https://www.speedway.fr/2304-blouson-moto?filters=21_457_421&no_permalink=1
- Tri par prix croissant : https://www.speedway.fr/2304-blouson-moto?orderby=price&orderway=asc&no_permalink=1
- Filtre par prix croissant et tri par couleur : https://www.speedway.fr/2304-blouson-moto?filters=6_4&orderby=price&orderway=asc&no_permalink=1
- Etc.
Les filtres et les tris peuvent s’additionner, avec la clé des dizaines ou des centaines de milliers de combinaisons possibles. Vous imaginez les risques pour votre référencement naturel si Google pouvait indexer toutes ces URL ? Toutes les combinaisons partagent la même balise canonical : <link href=”https://www.speedway.fr/2304-blouson-moto” rel=”canonical”> : ainsi, Google et les autres moteurs n’indexent que la page principale.
Éviter une duplication liée à des paramètres avec une self-canonical
Vous avez certainement déjà remarqué l’ajout de paramètres en fin d’URL, essentiellement à des fins de tracking :
- utm_campaign : désigne la campagne du lien ;
- utm_medium : indique le canal d’acquisition ;
- utm_source : précise la provenance du trafic ;
- utm_term : distingue les mots-clés ;
- utm_content : permet de différencier plusieurs contenus.
Vous ne voulez pas que Google indexe à la fois https://www.benjaminthiers.net/boite-a-outils/exploration-indexation-seo/, https://www.benjaminthiers.net/boite-a-outils/exploration-indexation-seo/?utm_campaign=ads, https://www.benjaminthiers.net/boite-a-outils/exploration-indexation-seo/?utm_campaign=newsletter, etc. : vous pouvez ajouter une self-canonical sur chaque page indexable de votre site avec un entête HTTP ou une balise canonical <link href=”https://www.benjaminthiers.net/boite-a-outils/exploration-indexation-seo/” rel=”canonical”> : vous éviterez ainsi l’indexation des URL avec des UTM et autres paramètres.
Réaliser de l’A/B testing sans déstabiliser son SEO
L’A/B Testing est une pratique répandue en marketing digital, qui consiste à tester plusieurs versions avec des interfaces utilisateurs différentes pour déterminer celle qui offre les meilleurs résultats.
Par exemple, une boutique en ligne peut valider une version alternative de ses pages produits avec un bouton de mise au panier déplacé ou d’une autre couleur :
- Une version alternative de votre template produit est créée ;
- Une partie des visiteurs est aléatoirement dirigée vers cette version alternative ;
- Vous analysez vos indicateurs clés de performance et vous choisissez de déployer ou la version alternative.
Quels sont les avantages SEO offerts par les URL canoniques ?
La balise canonical présente de nombreux avantages au service de votre SEO, que ce soit pour limiter les risques de cannibalisation interne ou pour optimiser le crawl par les moteurs de recherche.
La réduction du risque de cannibalisation interne
Un risque de cannibalisation survient lorsque plusieurs pages web de votre site possèdent le même contenu, ou répondent à la même intention de recherche avec des contenus différents. Les problèmes liés à la cannibalisation interne sont nombreux :
- Perte ou instabilité de vos positions si la page qui répond le moins bien à l’intention de recherche est retenue ;
- Baisse de vos conversions, notamment si une page blog prend le pas sur une page e-commerce ;
- Envoi d’un signal SEO négatif en cas de nombreuses pages en doublons ;
- Etc.
L’utilisation d’URL canoniques réduit considérablement le risque de cannibalisation interne lié à des pages identiques ou très similaires. Mais elle n’est pas une solution pour pallier à une stratégie éditoriale incohérente, dans laquelle vous publiez plusieurs contenus ciblant la même intention de recherche. Pour prévenir ce risque particulier, vous devez éviter de rédiger des contenus sur des thèmes sur lesquelles votre site web est déjà positionné avec des pages pertinentes, qui se positionnent et qui convertissent.
En choisissant vous-même vos URL canoniques, vous gardez par ailleurs un certain contrôle sur les pages web que vous désirez faire remonter sur les pages de résultats.
L’amélioration de la popularité de l’URL canonique
Les pages web canonicalisées transfèrent une partie de leur PageRank et de leurs signaux SEO à l’URL canonique. En d’autres termes, votre URL canonique bénéficie d’un léger atout si :
- Les URL canonicalisées reçoivent de la popularité grâce au maillage interne ou au netlinking ;
- Captent du trafic et sont susceptibles d’envoyer des signaux utilisateurs positifs.
L’optimisation du processus d’exploration (crawl)
Les moteurs de recherche (Google en tête) limitent le nombre de pages explorées simultanément pour ne pas surcharger les serveurs de votre site. Par ailleurs, l’exploration du web composé d’un nombre exponentiel de fichiers et de contenus mobilise des ressources sans cesse croissantes, et les moteurs se focalisent sur les sites, les types de pages ou les répertoires les plus pertinentes pour maximiser le bénéfice de leurs actions d’exploration. Le terme « budget de crawl » revient souvent en SEO pour désigner ce phénomène.
L’exploration d’un grand nombre de pages web de faible qualité ou dupliquées se fait au détriment du crawl de vos pages stratégiques, celles que vous avez travaillées pour vous positionner sur des requêtes importantes pour votre activité et votre visibilité : l’utilisation d’URL canoniques réduit le risque de dispersion des Googlebot (et autres robots d’exploration).
Un meilleur suivi de vos métriques
En suivant le trafic généré par toutes les pages web qui partagent la même URL canonique, vous améliorez l’analyse de vos indicateurs clés de performance.
Imaginez par exemple que des outils comme Google Search Console, GA4 ou Matomo Analytics remontent des informations sur 5 pages web qui partagent la même en-tête ou balise Canonical : vous pouvez mieux saisir les mécanismes d’acquisition et de conversion liés à la page canonique.
Comment vérifier la bonne gestion des URL canoniques ?
Plusieurs solutions et outils vous permettent de vérifier la présence d’une balise <link rel=”canonical”> sur les pages de votre site web.
L’affichage du code source
Vous voulez savoir si une page web comprend une balise <link rel=”canonical”> ? Affichez simplement son code source :
- Rendez-vous sur votre navigateur web préféré et accédez à la page que vous souhaitez contrôler ;
- Utilisez le raccourci Ctrl+u pour afficher le code source ;
- Recherchez le terme canonical à l’aide de la fonction recherche (raccourci : Ctrl+f).
L’utilisation d’une extension sur votre navigateur
La recherche de la balise <link rel=”canonical”> via le code source est fastidieuse. Et si vous utilisiez une extension pour valider sa présence et afficher l’URL canonique ?
De nombreuses extensions proposent cette fonctionnalité. En ce qui me concerne, j’utilise Detailed SEO Extension, mais vous en trouverez d’autres.
L’utilisation d’un crawler pour explorer l’ensemble de votre site
Un crawler est un logiciel qui reproduit l’exploration de votre site par les robots des moteurs de recherche. Il collecte un grand nombre d’informations, dont la présence d’URL canoniques pour chaque page visitée. Vous pouvez facilement exporter des rapports complets pour vérifier les situations potentiellement à risque et identifier les éléments problématiques :
- Pages qui indiquent une URL canonique différente
- Pages qui indiquent une URL canonique non indexable
- Pages qui ont indiquent plusieurs URL canoniques
- etc.
Le rapport Pages de Google Search Console
Cette solution gratuite mise à la disposition des éditeurs de sites web par Google est également infiniment précieuse à bien des égards. Plusieurs rapports présents dans la catégorie Indexation > Pages vous informent notamment sur la prise en compte de vos canonical tags par le moteur de recherche leader en France.
Page en double : Google n’a pas choisi la même URL canonique que l’utilisateur
Les moteurs de recherche ne respectent pas toujours votre spécification d’une URL canonique, si d’autres signaux contradictoires suggèrent qu’une autre page est plus importante.
Votre maillage interne doit être en adéquation avec vos spécifications. Vous spécifiez par exemple dans votre balise <link rel=”canonical”> les URL avec un slash à la fin, mais les liens dans votre menu principal pointent tous vers les versions sans slash à la fin : Google (et les autres moteurs) ne vont pas vous suivre, et vont choisir l’URL canonique indiquée par votre maillage interne. En cas de pages en doublons, votre fichier sitemap doit également mentionner uniquement les versions canoniques.
Pensez également à contrôler votre netlinking. Peut-être que les pages choisies par Google ont des liens entrants, et qu’elles sont à cause de cela considérées comme plus importantes. Vous pouvez vérifier les liens entrants vers votre site web dans Google Search Console (cliquez sur Liens dans le menu à gauche), ou utilisez une solution tierces (Ahrefs, Semrush, Majestic SEO, etc.).
Page en double sans URL canonique sélectionnée par l’utilisateur
Ce rapport vous permet d’identifier les pages considérées comme des doublons qui ne sont pas canonicalisées. En d’autres termes, vous mettez le doigt sur les risques de duplication et de cannibalisation interne.
Balise ou entête HTTP, il ne vous reste plus qu’à déployer la solution technique qui répond le mieux à votre situation !
En savoir plus : Pages en double sans URL canonique sélectionnée par l’utilisateur
Autre page avec balise canonique correcte
Ce rapport n’est pas inquiétant, car il a pour mission de mentionner les pages web qui spécifient une URL canonique différente. La page https://www.monsite.com/categorie?manufacturer=5
Ce rapport vous indique en réalité les URL trouvées par Google qui spécifient une autre URL canonique. La page https://www.benjaminthiers.net/boite-a-outils/maillage-interne/?utm_source=linkedin remontera par exemple dans ce rapport car elle affiche la balise canonical <link rel=”canonical” href=”https://www.benjaminthiers.net/boite-a-outils/maillage-interne/”>.
Je vous invite à consulter toute de même ce rapport de façon régulière, car il peut vous remonter des problèmes que vous n’auriez pas identifiés.
En savoir plus : Autre page avec balise canonique correcte