Lemmatisation et racinisation pour le SEO

Une des taches essentielles des moteurs de recherche sophistiqués comme Google est d'analyser les textes qu'ils trouvent sur Internet et de comprendre au mieux leur contenu. Pour faire ce travail efficacement, les moteurs de recherche ont besoin de regrouper les mots "proches". Ce travail s'appelle la lemmatisation (en anglais : lemmatization).

La Lemmatisation vs la racinisation

La lemmatisation désigne l’analyse lexicale d’un texte dans le but de regrouper les mots réels d’une même famille. Les mots d’une même famille sont donc réduits en une unique entité appelée « lemme » ou « forme canonique ».

Ainsi la lemmatisation consiste à regrouper ensemble les différentes formes d’un mot unique.

La lemmatisation regroupe les différentes formes que peut prendre un mot : le pluriel, le verbe à l’infinitif, le verbe conjugué à tous les temps, le nom ….

La racinisation (en anglais : stemming) désigne l’analyse sémantique des mots afin d’identifier et de regrouper les différentes formes d’un même mot autour d’une racine (appelé « stemme » ou « stem »).

La racine d’un mot (ou le stemme) est identifiée par la suppression du préfixe et ou du suffixe d’un mot.

Un point différenciant important entre la lemmatisation et la racinisation : un lemme est un mot réel de la langue analysée contrairement à la racine qui n’est généralement pas un mot réel (car basée sur la proximité sémantique)

Voici un exemple de lemmatisation et de racinisation :

Lemme Mot
être être
es
sera
fut
Racine Mot
cherch chercher
cherchons
chercheurs
chercheuses

Notez que l'on peut on peut rencontrer des cas où la racine d’un mot est un mot réel. Par exemple : les mots « frontal » et « front » ont pour racine « front » qui est également un mot réel.

La lemmatisation appliquée au SEO

Dans le cadre de l’optimisation SEO, nous allons nous intéresser au lemme (la lemmatisation) car il s’agit de mots réels qui pourraient être cherchés dans les moteurs de recherche.

La lemmatisation pour les moteurs de recherche

Lorsqu’un moteur de recherche analyse votre page web, il recherche les mots ayant la même racine et les regroupe afin d’identifier le sujet principal de votre page.

Le moteur de recherche fait donc un travail d’identification et d’extraction des mots ayant le même lemme dans un texte donné.

Il sera ainsi capable de regrouper toutes ces variantes autour d'un lemme principal.

Exemple :

Sur l’analyse de notre page https://www.zinaweb.com/mot-cle/, voici ce que la lemmatisation pourrait donner pour le mot « Analyser »

Lemme principal retenu Variantes de mot détecté
Analyser analyser
analysez
analyses

Grâce à la lemmatisation, les robots retiendront ici « analyser » comme mot clé principal mais prendront également en compte les autres variantes dans l’évaluation de la densité des mots clés de la page crawlée.

La lemmatisation permet donc de saisir de manière plus précise le contenu globale d’une page.

La lemmatisation appliquée à l’optimisation d’un contenu

Lors de l’élaboration de votre stratégie de mots clés et lors de la rédaction de votre contenu, vous devez faire le travail inverse du moteur de recherche.

Il faut commencer par identifier le mot clés principal puis rechercher toutes ses déclinaisons possibles. Vous placerez ensuite ces variantes dans des zones stratégiques de votre page.

La lemmatisation utilisée dans le SEO consiste à augmenter la densité de votre mot clés cible en utilisant un maximum de variante de ce dernier grâce notamment aux préfixes et aux suffixes. Vous enrichissez votre contenu en étant moins répétitif sur un mot précis.

Le lemmatisation permet également, grâce à toutes les déclinaisons possibles d’augmenter le nombre de requêtes différentes par lesquelles les internautes pourraient vous retrouver.

Comme chaque mot a une racine et des formes fléchies, il est nécessaire de les identifier pour une optimisation SEO avancée des mots clés de vos pages.

La lemmatisation peut également être utile pour évaluer la qualité de backlinks d’un site donné puisqu’elle permet de varier le texte du backlink tout en optimisant le mot clé cible.

Outil de lemmatisation pour optimiser le SEO

ZinaWeb a enrichi son outil d’analyse de la densité de mot clés en y intégrant la lemmatisation pour vous permettre d’analyser le contenu de votre page de manière précise.


La lemmatisation par ZinaWeb est accessible à tous, il suffit de lancer l’analyse d’une page ici :
ANALYSER


Voici un exemple de résultat :

Le rapport sur la densité des mots clés intégrant la lemmatisation vous présente :

  • Le mot principal qui correspond au lemme de la famille de mots analysés
  • Les variantes du mot principal (lemme) détectées dans la page analysée (avec leur nombre d'occurences entre parenthèse)
  • Le poids du mot (lemme) calculé en fonction de l’occurrence et de la position sur la page (pondération).
  • Le nombre d'occurrences indique le nombre de répétition global de tous les mots avec le même lemme dans la page.
  • Positions indique l’emplacement des mots clés dans les balises HTML de la page analysée
  • Action : permet de voir les mots choisi dans le code HTML de la page.