URLs & URLs "SEO Friendly"

Qu'est-ce qu'une URL ?

L'URL (Uniform Resource Locator) est une adresse qui désigne une ressource disponible sur l'Internet. C'est donc grâce à elle qu'un navigateur tel que Firefox ou Internet Explorer peut récupérer auprès d'un serveur Web distant le contenu demandé par son utilisateur.

Par exemple ceci est une URL: "https://www.monsite.com/aaa/bbb.html". Lorsqu'un utilisateur indique cette URL à son navigateur, voici ce qui se passe :

  • le navigateur extrait de l'Url le nom de domaine (www.monsite.com)
  • avec ce nom de domaine, le navigateur peut se connecter au serveur Web du site Web concerné
  • le navigateur transmet ensuite le reste de l'URL au serveur Web (/aaa/bbb.html)
  • à partir de cette information, le serveur Web trouve - ou construit dynamiquement - la ressource visée (fichier HTML, images...) et renvoie le contenu au navigateur du client pour l'affichage final.

Comment se décompose une URL ?

Tout comme une adresse postale (numéro de rue, nom de rue, ville, code postal...), une URL se décompose en plusieurs éléments. Examinons déjà un cas simple:

https://www.monsite.com/aaa/bbb.html
  • 'http' : cela indique au navigateur le protocole réseau qui doit être utilisé pour communiquer avec le server Web distant. HTTP est de très loin le protocole le plus répandu mais d'autres valeurs possibles sont: https, ftp...
  • 'www.monsite.com' : cela désigne le nom de domaine. A partir de cette information, le navigateur peut savoir quel serveur Web distant gère le site concerné (grace à une opération appelé DNS lookup)
  • '/aaa/bbb.html' : c'est le chemin de l'URL. Le serveur Web, avec cette information saura comment obtenir la ressource désirée par l'utilisateur.

Certaines URLs sont plus sophistiquées. Examinons par exemple celle-ci :

https://login:pass@www.monsite.com:8080/aaa/bbb.html?arg1=val1&arg2=val2
  • 'login:pass' : cela désigne un nom d'utilisateur et un mot de passe pour accéder à une ressource qui serait sécurisée par le serveur Web
  • '8080' : cela désigne le port sur lequel 'écoute' le serveur Web. Ce concept est un peu trop technique pour être détaillé ici. Sachez simplement que s'il n'est pas indiqué explicitement, le port par défaut du protocole HTTP est 80
  • 'arg1=val1&arg2=val2' : c'est la partie argument de l'URL (query) située après le ?. Ces arguments sont en fait surtout utiles pour les pages dynamiques (c'est à dire que le serveur Web génère le contenu à servir à la volée, par exemple pour intégrer des informations d'une base de données). Si ces paramètres contiennent des caractères spéciaux, ceux ci doivent être encodés pour être interprété correctement par le serveur Web ('URL encode'). Par exemple un espace ' ' se transforme en %20

Il est important de noter qu'aucune spécification n'indique précisément quel encodage de caractère est utilisé pour une URL. En fait cela dépend de chaque serveur Web ! Pour ne pas avoir de souci, il est très important d'éviter tous les caractères spéciaux (accents, ! #...) dans la partie chemin d'une URL. Et et il faut encoder la partie 'query' scrupuleusement.

Pourquoi les URLs de votre site sont elles importantes ?

Il y a plusieurs raisons pour lesquelles il faut s'intéresser de près aux URLs:

  • tout d'abord le choix du domaine, qui peut parfois être un choix marketing essentiel à la réussite d'un projet
  • plus l'URL d'accès à un site est simple, plus l'utilisateur pourra y accéder facilement
  • naviguer dans un site avec des URLs simples est plus agréable que d'avoir des grandes URLs incompréhensibles.
  • enfin les URLs sont importantes pour le référencement naturel (SEO). Si les mot-clés de votre page sont aussi dans l'URL, cela peut favoriser son référencement (cependant attention aux discours catégoriques 'moi je sais comment fonctionne Google' car les règles du jeu changent en permanence).

Qu'est ce que l'URL Rewriting ?

L'expression URL Rewriting est utilisée souvent, abusivement et un peu à toutes les sauces pour impressionner un auditoire non spécialiste. L'URL Rewrite est une fonctionnalité très puissante qui est présente dans la plupart des serveurs Web (Apache, IIS...). Elle permet notamment au serveur Web de réécrire l'URL donnée par le navigateur en une autre, selon des règles choisies par le concepteur du site.

L'URL Rewriting est donc très utilisé pour avoir des URLs 'propres' sur un site même si en interne pour le serveur Web elle sont en fait très sophistiquées.

Comment bien choisir sa stratégie d'URL ?

La stratégie d'URL le plus adaptée à votre site dépend de nombreux critères:

  • de vos compétences informatiques
  • du temps que vous êtes prêt à y consacrer
  • du nombre d'URLs de votre site
  • de choix marketing
  • de votre stratégie SEO

Pour un gestionnaire de site dynamique et ambitieux, il est essentiel que l'équipe technique lui donne le moyen de pouvoir choisir ses URLs facilement (et de pouvoir changer d'avis) sans que cela nécessite beaucoup de travail technique. Cette gestion n'est d'ailleurs pas toujours facile pour un site complexe mais elle est néanmoins nécessaire.

Pour un site personnel et assez statique, il n'est pas nécessaire d'appliquer une stratégie d'URL très sophistiquée. Appliquez juste quelques règles de bon sens et tout ira bien (lisibilité, concision des URLs...).

L'outil gratuit ZinaWeb pour analyser les URLs de vos pages


Auditez votre site Web gratuitement :
ANALYSER


Pour lancer l'analyse ZinaWeb, il vous suffit de saisir le lien vers votre page dans la zone ci-dessus et de cliquer sur le bouton Analyser. Vous pourrez alors accéder aux différentes pages du rapport.

Pour en savoir plus...

Si cet article vous a donné envie de vous documenter davantage sur le sujet des URLs, voici quelques liens utiles :

D'autres articles de ZinaWeb dans la rubrique Technique ou Référencement peuvent vous être utiles.