Sommaire
Google Search Console est la solution gratuite incontournable pour piloter son référencement naturel avec des rapports complets et des fonctionnalités pour agir directement sur votre visibilité naturelle. La partie Indexation recense notamment les différents motifs qui peuvent entraver l’exploration et l’indexation de vos pages. Parmi les rapports, la rubrique Pages peut afficher le rapport Bloquée en raison d’une interdiction d’accès (403). Qu’est-ce qu’un code HTPP 403 ? Comment traiter ces erreurs ? Je vous donne toutes les informations pour comprendre et corriger ce problème.
Qu’est-ce qu’un code d’erreur HTTP 403 ?
Le code d’erreur HTTP 403 (Forbidden) est renvoyé car l’accès à une ressource est refusé par votre serveur au navigateur web de l’internaute ou au robot d’exploration du moteur de recherche. Les raisons expliquant ce refus sont nombreuses :
- L’adresse IP est bloquée ou restreinte : l’utilisateur ou le robot d’indexation n’est pas autorisé à accéder à cette ressource. Parfois, toutes les IP ou presque sont bloquées, sauf certaines IP spécifiques.
- L’utilisateur n’est pas authentifié : s’il s’agit d’une page privée accessible uniquement aux utilisateurs identifiés, tous les autres utilisateurs se voient renvoyer un code HTTP 403.
- L’utilisateur est authentifié, mais ne dispose pas des permissions nécessaires : l’utilisateur est bien identifié, mais il ne dispose pas des autorisations nécessaires pour accéder à cette page.
- La ressource demandé n’existe pas ou plus : plutôt qu’une page 404 (introuvable), l’éditeur du site a privilégié une erreur 403 qui permet d’éviter la diffusion d’informations confidentielles.
Vous pouvez trouver la mention Bloquée en raison d’une interdiction d’accès (403) dans le rapport Pages de la rubrique Indexation. Comment y remédier ?
Où trouver le rapport Bloquée en raison d’une interdiction d’accès (403) ?
Ce rapport est uniquement visible si votre site présente des URL renvoyant ce code HTTP. Vous pouvez le trouver dans le rapport Indexation > Pages, dans le listing des motifs expliquant la non indexation de vos URL.
En cliquant dessus, vous obtiendrez la liste de toutes les URL concernées, ou un échantillon de pages si un grand nombre d’URL est concerné.
Quelles sont les conséquences pour mon SEO ?
La page qui renvoie un code HTTP 403 au Googlebot ou à un autre robot d’exploration d’un moteur de recherche n’est pas accessible. Puisque son contenu ne peut pas être lu, il ne sera pas exploré et indexé.
Une multiplication des codes 403 envoie un signal péjoratif aux moteurs de recherche :
- Vous détournez les crawlers des “bonnes” URL, celles qui sont destinées à être explorées et indexées, et consommez inutilement du budget crawl ;
- Vous dégradez l’expérience utilisateur, car les internautes (et les crawlers) qui tombent sur une 403 se retrouvent dans une impasse.
Vous devez donc limiter l’accès des moteurs de recherche (et des internautes) à des URL qui renvoient volontairement les codes d’erreur de type 403.
Comment corriger un code HTTP 403 (Forbidden) ?
Je distingue deux cas de figure qui demandent deux approches distinctes. En effet, votre stratégie n’est pas la même si vous avez volontairement bloqué ou non l’indexation des URL.
Le code HTTP 403 n’est pas justifié
L’envoi d’un tel code HTTP peut être le fruit d’une erreur technique. Vous devez remonter l’information à votre webmaster qu’il corrige ce bug. Exportez le listing des URL concernées dans le rapport Bloquée en raison d’une interdiction d’accès (403) pour l’aider à affiner son analyse.
Vous pouvez vérifier la correction du bug facilement en utilisant un crawler comme Screaming Frog :
- Téléchargez et lancez Screaming Frog (gratuit jusqu’à 500 URL) ;
- Utilisez le mode Liste ;
- Saisissez votre liste d’URL en 403 ;
- Vérifiez le nouveau statut (le “bon” statut est 200).
Le code HTTP 403 est justifié
Souvent, le renvoi d’un code HTTP 403 est volontaire (Cf. Qu’est-ce qu’un code d’erreur HTTP 403) ? Il ne représente pas de danger immédiat pour votre référencement naturel, mais vous devez prendre certaines mesures pour optimiser votre SEO.
Vous ne souhaitez pas que les moteurs de recherche accèdent à ces pages ? Vous devez restreindre l’exploration de ces pages par les robots d’exploration des moteurs de recherche :
- En n’autorisant pas l’exploration de ces pages grâce au fichier robots.txt ;
- En vous assurant que les URL concernées ne soient pas dans votre fichier sitemap.xml ;
- En ne maillant pas ces pages sur votre site, ou si les utilisateurs doivent y accéder en utilisant une méthode d’obfuscation des liens en JavaScript, ou à défaut en ajoutant un nofollow (Google pourra quand même accéder aux URL).
Permettre à Google d’accéder à une page en 403
Vous souhaitez interdire l’accès aux utilisateurs non connectés, mais autoriser Google à y accéder ? Vous pouvez autorisez spécifiquement les requêtes Googlebot sans authentification en validant son identité. Google fournit pour cela une documentation détaillée.
Besoin d’aide pour maîtriser Google Search Console ?
Vous désirez développer votre visibilité sur Google, et vous souhaitez être accompagné(e) par un consultant SEO ? Vous pouvez me contacter en me présentant votre projet : je vous répondrai dans les meilleurs délais.