La partie Index réunit trois rapports précieux pour les éditeurs de sites et les référenceurs :
- Pages
- Sitemaps
- Suppressions
La rubrique Pages, située dans la partie Indexation (Google Search Console), liste notamment les pages non indexées, et vous communique les raisons à l’origine de cette absence d’indexation. Parmi les raisons évoquées par Google, vous pouvez trouver certaines URL référencées sous l’intitulé : Autre page avec balise canonique correcte.
Quel est le rôle de la balise canonique ?
Si vous avez déjà une expérience du référencement naturel, vous avez certainement entendu parler de la balise canonical. Elle sert en effet essentiellement à prévenir les risques de duplication de contenu.
En effet, parfois, plusieurs URL peuvent partager un contenu identique ou très similaire. Citons par exemple trois situations fréquentes :
- URL avec et sans slash : par exemple, le même contenu est accessible sur https://www.benjaminthiers.net/qui-suis-je et https://www.benjaminthiers.net/qui-suis-je/.
- Problème de protocole HTTP / HTTPS ou de sous-domaine : vos pages sont accessibles en même dans une version http et https, et parfois dans une version avec et sans www. Par exemple, les URL https://www.benjaminthiers.net/qui-suis-je/, http://www.benjaminthiers.net/qui-suis-je/, http://benjaminthiers.net/qui-suis-je/ et http://www.benjaminthiers.net/qui-suis-je/ renvoient le même contenu.
- Ajout de paramètres dans l’URL : pour intégrer des UTM, proposer des filtres ou des tris pour une page catégorie
- e-commerce ou blog, les URL peuvent intégrer des paramètres. Par exemple, https://threehorses.fr/categorie-produit/filet/ et https://threehorses.fr/categorie-produit/filet/?orderby=rating
L’indexation de plusieurs URL qui partagent le même contenu (ou un contenu très similaire dans le cadre d’un tri ou d’un filtre) présente des enjeux SEO. Avec les redirections 301, la balise canonical (canonique) fait partie des solutions les plus fréquentes pour éviter une duplication de contenu :
- Les URL qui partagent un contenu identique ou très similaire hébergent la même balise canonical entre leurs balises <head></head>
- La balise canonical reprend l’URL de la page que vous désirez indexer sur Google.
Par exemple, les URL https://threehorses.fr/categorie-produit/filet/ et https://threehorses.fr/categorie-produit/filet/?orderby=rating possèdent la même balise :
Si l’algorithme de Google arrive sur https://threehorses.fr/categorie-produit/filet/?orderby=rating, il va savoir qu’il ne doit pas indexer cette URL mais lui préférer https://threehorses.fr/categorie-produit/filet/
Le saviez-vous ? |
---|
Étymologiquement, ce qui est canonique correspond à ce qui suit la règle. Ce terme est notamment utilisé dans la religion chrétienne. Quatre évangiles sont reconnus comme canoniques par les Églises chrétiennes : les évangiles dits selon Matthieu, Marc, Luc et Jean. Les autres évangiles sont considérés comme apocryphes, ce qui signifie que leur authenticité n’est pas avérée. |
Quand l’algorithme crawle (= visite) https://threehorses.fr/categorie-produit/filet/?orderby=rating, il sait qu’il ne doit pas indexer et positionner cette URL. Il doit privilégier le référencement de l’URL canonique, telle que précisée dans la balise canonical : https://threehorses.fr/categorie-produit/filet/.
J’approfondis cette question dans un dossier consacré à la duplication de contenu SEO
Pourquoi Google Search Console remonte d’autres pages avec balises canoniques correctes ?
Dans votre rapport Pages, Google Search Console peut remonter une liste d’URL non indexées sous la dénomination “Autre page avec balise canonique correcte” :
Cette dénomination désigne des URL trouvées par l’algorithme de Google, qui renvoient vers une autre URL canonique dans leur balise canonical.
Par exemple https://www.benjaminthiers.net/?open_new_tab possède la en effet la balise canonical suivante :
Quels correctifs dois-je appliquer à mon URL ou à ma balise canonique ?
Le fait qu’un moteur de recherche comme Google détecte des pages qui possèdent une autre URL canonique est tout à fait normal. Vous avez une poignée de lignes dans votre rubrique “Autre page avec balise canonique correcte” ? Vous n’avez aucun souci à vous faire.
Vous constatez un nombre important (et croissant) d’URL concernées ? Des actions peuvent être entreprises pour optimiser votre SEO :
- Vous pouvez déjà vous assurer que les URL remontées ne sont pas liées à une configuration non optimale de votre CMS (par exemple, la génération d’une version avec paramètre pour les flux RSS). Une mise à jour ou un correctif peut régler l’ensemble de vos problèmes en un seul coup.
- Vous pouvez aussi obfusquer les liens vers les pages concernées. Vous pouvez aussi adopter une méthode plus radicale et les supprimer, si cela ne dégrade pas l’expérience utilisateur (UX).
- Vous pouvez par ailleurs vous assurer que votre fichier sitemap.xml n’intègre pas de pages web dont la balise canonical renvoie vers une autre URL. Vous éviterez ainsi que Google les explore inutilement.
Ainsi, vous éviterez que les crawlers (aussi appelés robots d’indexation) ne perdent leur temps à explorer des pages web qui n’ont pas vocation à être indexées et positionnées.