Erreurs 404 et le référencement naturel

Qu’est ce qu’une erreur 404 (page introuvable) ?

Techniquement une erreur 404 (également appelée « Page introuvable », ou « code HTTP 404 ») est un code d'erreur renvoyée par les serveurs Web hébergeant un site aux navigateurs ou aux moteurs de recherche qui tentent d'accéder au contenu d’une page qui n'existe plus. Voici un diagramme illustrant l'intéraction :

Page 404 personnalisée

Du point de vue du visiteur, une page d'erreur 404 se matérialise souvent par un message générique de type Erreur 404, 404 file not found, fichier introuvable ou la page n’existe plus.

Page 404 non personnalisée

Notez que dans la famille des codes d’erreurs il y a également le code d'erreur HTTP 410 qui est similaire au code 404. Ce code plus rare peut être utilisé par les Webmasters pour indiquer explicitement qu'une page a disparue et ne reviendra plus ("Page Gone" en anglais).

Pour en savoir plus sur les codes HTTP, vous pouvez consulter notre article sur le protocole HTTP.

Les causes d’une erreur 404

Un serveur Web renvoie une code HTTP 404 lorsqu'on lui demande une ressource qu'il ne trouve pas. Les causes peuvent être :

  • une URL qui existait auparavant mais à été définitivement supprimée et aucune redirection n’a été mise en place,
  • une URL où le Webmaster a fait une erreur lors de la saisie du lien interne ou externe, et qui n'existe pas
  • une mauvaise configuration des URLs automatisées par le système de gestion de contenu (les CMS tels que Wordpress, Joomla...) qui peut générer des URLs fausses.

Impact des erreurs 404 sur le référencement naturel

De manière générale, avoir des erreurs 404 n’est pas pénalisant pour le référencement naturel tant que leur proportion est raisonnable.

Il y a cependant 3 cas vraiment gênants :

  • si une des pages importantes de votre site renvoie par erreur un code 404 (par exemple suite à une erreur technique), il faut corriger de toute urgence ce point pour ne pas que que Google pense que la page a disparu et frustrer les visiteurs souhaitant accéder à la pages.
  • si un site externe intéressant a créée un backlink vers une URL de votre site en mettant une URL erronée. Dans ce cas nous vous conseillons de contacter le webmaster concerné pour lui signaler l'erreur. C'est une bonne occasion de récupérer un backlink intéressant pour le référencement naturel.
  • vous avez un nombre trop important d’erreurs 404 sur votre site : l’expérience utilisateur et le travail d’analyse des moteurs pourrait être gêné, ce qui à terme pourrait avec un impact négatif sur le référencement naturel de votre site.

D'une manière générale pour le référencement naturel, Google privilégie les sites de qualité qui fournissent des contenus utiles et accessibles aux internautes et aux moteurs de recherche. Et pour répondre à cette exigence de niveau de qualité lié au référencement naturel, c'est une bonne pratique de corriger régulièrement les erreurs 404.

Il faut donc détecter et corriger les erreurs 404 pour :

  • faciliter l’exploration (crawling) de votre site par les moteurs de recherche qui reviendront plus souvent.
  • améliorer l’expérience utilisateur
  • donner une meilleure image de votre site.
  • fidéliser votre audience
  • s'assurer que l'on ne perd pas un backlink intéressant à cause d'un simple faute de frappe sur le lien posé sur le site externe

Pour mieux comprendre l’impact des erreurs 404 sur le référencement naturel et surtout comprendre comment les erreurs 404 sont gérées par Google, voir la vidéo en anglais de Matt Cutts :

Quand faut-il renvoyer une erreur de type 404 (page not found) ?

Comme nous avons vu précédemment, les erreurs 404, lorsqu’elles sont utilisées dans les règles n’auront pas d’impact négative sur le référencement naturel. Il faut néanmoins faire attention à ne pas générer un nombre trop important de 404.

Pour savoir dans quel cas renvoyer une erreur de type 404 voici quelques questions à se poser :

  • Quel est le niveau de trafic généré par la page à supprimer ?
  • Des backlinks de qualité pointent-elles vers la page à supprimer ?
  • Est-ce qu’un contenu similaire à celui supprimé est proposé sur une autre page du site ?

En fonction des réponses, vous pourrez décider ou non de mettre en place une erreur de type 404 :

  • La page à supprimer génère un nombre important de visites et / ou de backlinks alors il est important de trouver une page avec un contenu similaire ou proche et faire une redirection 301 à la place d’une erreur 404.
  • Si le trafic ou le nombre de backlinks de la page sont quasi nul et qu’en plus aucune autre page ne propose de contenu similaire, alors renvoyer une erreur de type 404.

A chaque fois que l'on retire une page de son site, il faut bien sur retirer ou modifier tous les liens internes pointant sur l'URL correspondante.

Comment détecter et corriger les erreurs 404 ?

Pour corriger les URLs en erreur 404 vous pouvez :

  • utiliser un analyseur de site (tel que l'outil SEO de ZinaWeb) pour détecter tous les liens internes ou externes contenus sur votre site qui pointent sur un code d'erreur 404. Il faut ensuite intervenir sur les pages contenant ces liens erronées pour les corriger ou les retirer.
  • Utiliser les Google Webmaster Tools :
    • Aller dans > Exploration > Erreurs d’exploration. Là vous verrez la liste de toutes les URLs ou le crawler de Google (Googlebot) a rencontré un code 404
    • Cliquer sur une URL en erreur > Référencée sur. Là vous verrez la liste des site qui tentent de renvoyer du trafic vers votre site
    • Corriger ces erreurs 404 soit en contactant le webmaster soit en mettant en place une redirection 301 de l’URL indiquée dans Google Webmaster Tools vers la bonne URL.
  • exploiter les informations contenus dans les fichiers d'historiques (logs) de votre serveur Web. Ces fichiers sont généralement disponibles même si vous n'administrez pas vous mêmes vos environnements. Un simple commande de type grep pour recherche le code "404" suffit pour trouver toutes les fois ou votre serveur Web en renvoyer un code 404. Le champs Referer indiquera la page contenant le mauvais lien.

Pour les URLs mal écrites placées sur d’autres sites : cette étape est importante car peut-être que vous perdez une partie de votre trafic à cause d’urls mal écrites sur des sites externes. Pour récupérer ce trafic qui arrive sur une page d’erreur de type 404 :

Outil de détection des erreurs 404 d'un site

ZinaWeb fournit un outil pour détecter les erreurs 404 trouvées sur une page. La détection de l'ensemble des erreurs 404 d'un site se fait uniquement dans le cadre d'un audit complet.


Détecter gratuitement les erreurs 404 de votre page :
ANALYSER


La pages d'erreur 404 personnalisée

Plutôt que d'afficher un message technique neutre à leur visiteurs tombant une erreur 404, les Webmasters peuvent mettre en place une page d'erreur 404 personnalisée. C'est à dire une page plus attractive limitant au maximum le désagrément pour le visiteur. Voici un exemple :

Page 404 personnalisée

Google recommande clairement de mettre en place les pages d'erreur personnalisée, mais uniquement afin d'améliorer le confort des Internautes. Les pages d'erreurs personnalisées n'ont AUCUN d'impact particulier sur le référencement naturel d'un site. C'est plutôt une bonne pratique pour un Webmaster.

Avec les serveurs Web de type Apache, la mise en place d'une page d'erreur personnalisées pour le code HTTP 404 se fait en plaçant un commande de ce type dans le fichier .htaccess :

ErrorDocument 404 /404.html

Voici nos recommandations lorsque l'on met en place une page d'erreur 404 personnalisée :

  • Assurez-vous que la page d’erreur 404 personnalisé renvoie bien techniquement un code d’erreur 404, par avec l'outil SEO de ZinaWeb. Il ne faut surtout pas renvoyer un code 200, car sinon potentiellement toutes les URLs en erreur du site auraient en fait un contenu dupliqué.
  • Affichez un message clair qui indique que la page recherchée est introuvable
  • La page d’erreur 404 doit être intégrée à votre site, elle doit donc reprendre les codes couleurs, le graphisme et la navigation de votre site
  • Encouragez les internautes à visiter d’autres pages de votre site en ajoutant des liens vers des pages qui pourraient les intéresser.

Google Webmaster Tools signale de nombreuses erreurs 404, que faire ?

Sur votre compte Google Webmaster Tools (dans la section Exploration > Erreurs d’exploration), vous trouverez toutes les erreurs HTTP détectées par le Googlebot lors des explorations successives de votre site Internet.

Ne donnez pas trop d'importance au nombre total d’erreurs 404 signalé. L’information principale à regarder dans le tableau des erreurs 404 dans le Google Webmaster Tools est la date à la quelle l’erreur a été détectée.

En effet, la liste des erreurs 404 signalée par Google n’est pas toujours à jour, elle regroupe souvent de très anciennes erreurs 404 qui ont peut-être été corrigées depuis longtemps.

Pour « obliger » Google à nettoyer cette liste, il vous suffit de sélectionner la totalité des erreurs 404 signalées dans Google Webmaster Tools et de les indiquer comme étant « Corrigées ».

Après plusieurs jours regardez à nouveau ce tableau et voyez quelles sont les URLs à nouveaux signalées... c’est cette liste d’erreurs à jour qu’il faudra corriger.