Sommaire
La partie Index réunit trois rapports particulièrement utiles aux éditeurs de sites et les référenceurs :
- Pages
- Sitemaps
- Suppressions
La rubrique Pages, que l’on retrouve sur Google Search Console (GSC) dans la partie Indexation, propose une liste des URL non indexées, et vous communique les différents motifs qui expliquent les causes de cette absence d’indexation. Parmi les raisons les plus mises en avant par Google, vous trouverez probablement des URL regroupées sous l’intitulé suivant : Explorée, actuellement non indexée.
Quelle est la différence entre l’exploration et l’indexation ?
Le processus d’exploration et d’indexation repose sur trois grandes étapes successives :
- la détection
- l’exploration
- l’indexation
Vous pouvez consulter à ce sujet mon dossier dédié : Exploration et indexation SEO
L’exploration, un préalable à l’indexation
Une fois une URL détectée (étape n°1), le robot d’indexation de Google, appelé Googlebot, peut décider d’explorer le contenu de votre page web (étape n°2). Cela signifie qu’il parcourt votre page web pour déterminer notamment :
- la lisibilité du code source et son adéquation avec les standards fixés par l’algorithme (compatibilité mobile, temps de chargement, etc.) ;
- la qualité du contenu éditorial, des images, éventuellement des vidéos et des données structurées présentes sur la page.
Mais rien n’est encore gagné ! Tant que vous n’atteignez pas l’étape de l’indexation, vous êtes “inexistant” sur Google.
L’indexation, ultime étape avant votre référencement
Quand l’algorithme reconnait la pertinence de votre contenu, il passe à la 3e étape, celle de l’indexation. Cela signifie qu’il vous ajoute dans son index en sauvegardant une “photographie” de votre page, appelée version cache, dans ses serveurs.
Vous pouvez comparer l’indexation sur Google à l’ajout d’un produit dans le catalogue de la centrale d’achat d’une chaine d’hypermarchés. Ce n’est pas une garantie de se retrouver en tête de gondole. Mais un produit non présent en centrale d’achat sera tout simplement totalement absent des rayons !
En d’autres termes, votre URL doit être au préalable dans l’index de Google pour avoir une chance de se retrouver en première page.
Quelle stratégie face à une page explorée, actuellement non indexée ?
Depuis le début des années 2020, nous constatons une diminution des indexations de pages dans les datacenters (centres de données) de Google. En d’autres termes, de plus en plus d’URL restent bloquées entre l’étape de l’exploration, et ne passent pas à l’étape de l’indexation.
Les URL concernées sont remontées par Google Search Console dans Indexation => Pages, dans l’onglet Non indexées et sous le motif Explorée, actuellement non indexée.
Vous pouvez apporter des correctifs pour réduire le nombre de pages explorées, actuellement non indexées, remontées par Google Search Console.
Auditez les URL explorées, actuellement non indexées
Je vous invite à exporter l’ensemble des pages listées par Google Search Console pour ce motif.
Vous pouvez tout d’abord vous assurer que les URL explorées et non indexées doivent bien se retrouver sur Google. Par exemple, des pages sans contenus, des filtres ou des tris de pages catégories e-commerce n’ont pas vocation à être indexées et positionnées. Vous devrez alors prendre les mesures qui s’imposent pour limiter leur détection et leur exploration, et empêcher leur indexation :
- retrait des URL du fichier sitemap (si elles y figurent) ;
- réduction, suppression ou obfuscation des liens qui pointent vers elles ;
- ajout d’une balise <meta name=”robots” content=”noindex“> ou d’une balise <link rel=”canonical”>.
Je vous conseille aussi d’analyser les URL, pour essayer de trouver un élément commun pouvant expliquer l’absence d’indexation.
Déterminez des types de pages problématiques
L’analyse des types de pages concernés par ce motif peut vous apporter de précieuses informations :
- S’agit-il de pages produits ou catégories e-commerce, d’articles de blogs, de pages guides ? Les types de pages stratégiques requièrent votre attention prioritaire.
- Quelle est la proportion de pages qui remontent sous l’étiquette “explorée, actuellement non indexée”, pour un type de page donné ? Vous devez considérer le volume d’erreurs remontées par rapport au nombre total d’URL de ce type sur votre site. Par exemple, 25 URL de catégories e-commerce explorées, actuellement non indexées, représentent un souci particulièrement problématique si vous n’avez en tout et pour tout que 30 catégories e-commerce sur votre site. À l’inverse, 100 URL de produits e-commerce explorées et non indexées représentent un souci bien moins inquiétant, si vous avez un total de 5000 pages produits.
Identifiez d’autres facteurs SEO problématiques
D’autres facteurs peuvent aussi expliquer une indexation difficile :
- Quel est le code réponse HTTP renvoyé ? Parfois, des pages remontées par Google sont tout simplement en 301 (par exemple, versions avec ou sans slash). Vous pouvez utiliser un outil d’analyse des redirections, ou un crawler (cf. point suivant).
- Quel est le niveau de profondeur des URL remontées ? Si 90% des pages remontées par Google Search Console affichent un niveau de profondeur supérieur ou égal à 5, vous avez potentiellement identifié la cause du problème ! Pour connaître le niveau de profondeur, vous pouvez utiliser un crawler de type Linkexaminer (gratuit), Screaming Frog ou Botify (payants).
- Quel est le temps de chargement des pages problématiques ? Un temps de chargement (excessivement) long peut aussi expliquer les difficultés d’indexation de votre site. Vous pouvez vous appuyer pour cela sur différents outils, propres à Google (GA4, Google Search Console, PageSpeed Insights) ou développés par des tiers (Uptrends, GT Metrics…).
- Les pages explorées et non indexées possèdent-elles un contenu dupliqué, un texte trop court ou inexploité ? Un travail sur la sémantique sera alors nécessaire.
- Les URL concernées passent-elles le test de compatibilité mobile ? Une page non mobile friendly, à l’ère du mobile first, peut être plus difficilement indexée. Vous pouvez vous rendre dans la Search Console pour avoir la liste des pages qui ne sont pas mobile-friendly.
Quelles actions SEO sont nécessaires pour indexer vos pages ?
Si un type de page particulier remonte plus particulièrement sur Google Search Console, vous devrez vous focaliser sur celui-ci.
Commencez par un audit technique SEO
Je vous conseille de commencer par réaliser un audit technique SEO des pages concernées :
- Analyse des codes de réponse : un crawler vous permet d’identifier les URL en 301, et les pages qui hébergent les liens vers celles-ci et que vous devez corriger
- Lisibilité du code source : vous pouvez utiliser pour cela la fonctionnalité “Inspection de l’URL” proposée par Google Search Console.
- Respect des standards du W3C : le non respect des standards HTML n’est pas un facteur bloquant en référencement naturel, mais ça ne fait jamais de mal de vérifier les fondamentaux en utilisant https://validator.w3.org/.
- Compatibilité mobile : vous pouvez passer par Search Console ou par l’outil https://search.google.com/test/mobile-friendly.
- Performance / temps de chargement : vous pouvez vous focaliser sur les signaux web essentiels, ou aller plus loin avec une solution tierce plus complète.
Apporter les correctifs requis peut résoudre vos problèmes d’indexation.
Poursuivez par un audit sémantique SEO
Une page peut être explorée, et actuellement non indexée, à cause d’un contenu non pertinent
- Présence et optimisation des balises sémantiques essentielles : vous pouvez commencer par vérifier la présence d’une balise <title> unique et optimisée et d’un balisage <Hn> (balises <h1>, <h2>, etc.) de qualité sur toutes vos URL.
- Présence d’un contenu unique et pertinent : le contenu est l’un des principaux leviers du référencement naturel, et des pages sans texte, ou avec un contenu dupliqué, trop pauvre ou sans intérêt, peuvent passer à la trappe entre les étapes de l’exploration et de l’indexation.
- Données structurées inadaptées : les données structurées apportent des informations additionnelles aux algorithmes de Google, et peuvent déclencher l’affichage d’extraits enrichis (rich snippets) sur la page de résultats. Mais des données erronées ou employées à mauvais escient peuvent nuire à votre SEO.
Accélérez l’indexation des pages explorées
L’outil “Inspection de l’URL” de Google Search Console intègre une fonctionnalité “Demander une indexation”. Vous passez ainsi dans une liste prioritaire et vous pouvez obtenir plus rapidement un ajout dans l’index Google.
Mais cette méthode a ses limites, et elle ne peut pas vous aider en cas d’un volume trop important d’URL à traiter. Vous devrez renforcer votre maillage interne pour indexer les pages explorées :
- Assurez-vous que vos URL sont bien listées dans votre fichier Sitemap, et vérifiez que Google accède bien à celui-ci ;
- Vérifiez que vos pages ne sont pas orphelines, et qu’elles disposent bien de liens internes qui pointent vers elles ;
- Réduisez le niveau de profondeur, ou ajoutez de nouveaux liens depuis des pages web d’une thématique similaire ou voisine ;
- Obtenez éventuellement des liens hypertextes depuis d’autres sites, pour booster le SEO de vos URL les plus stratégiques (Cf. .
Vous pouvez obtenir un coup de fouet en ajoutant provisoirement un lien sur la page d’accueil, en footer ou dans un menu thématique (comme par exemple “Articles / Produits les plus populaires”).
Faites appel à un professionnel du référencement
Vous pouvez aussi vous rapprocher d’un professionnel du référencement naturel pour auditer votre site internet. Consultant SEO depuis 2003, je vous accompagne dans la visibilité de votre site web sur Google par l’intermédiaire de l’agence Digimood. Contactez-moi par message privé ou sur LinkedIn pour un point de situation et une proposition personnalisée.