Index Google : Définition

Une photo de Louis Maitreau

Bonjour, Je suis Louis Maîtreau, Consultant SEO.

J’accompagne celles et ceux qui souhaitent améliorer leur référencement naturel pour arriver dans les premières pages de résultats sur Google.

Le but ? Augmenter le trafic sur le site et  par conséquent augmenter le chiffre d’affaires.

Pour cela, je vous propose un accompagnement personnel via des prestations de consulting ou alors je vous propose de vous former directement sur mon site à l’aide des formations en ligne avec un espace privé ainsi que des guides sur le référencement naturel mis en ligne sur le site.

Bon courage dans cette course au référencement.

Abonnez-vous !

Cliquez sur le bouton pour vous abonner à ma chaîne YouTube et recevoir mes derniers conseils :

Icone Youtube pour s'abonner à la chaine

En SEO, on définit l’index comme : une base de données où l’on stocke les informations, après les avoir collecté, analysé et traité. Tout ceci pour permettre une récupération rapide lors d’une recherche sur Google par exemple.

Un index est comme une copie du web dans lequel un internaute peut faire ses recherches. Les moteurs basés sur le cache stockent l’index avec le corpus (collection de documents). Quand quelque chose est ajouté au corpus, l’index est mis à jour.

Pourquoi utiliser un index ?

Sans index, trop de temps sera nécessaire pour chercher dans tout le corpus afin de trouver les documents liés à notre requête.

Créer un index signifie que le processus de récupération est plus rapide et que la précision est meilleure.

Le moteur de recherche n’a pas besoin de scanner chaque document pour savoir ce que c’est. Cela économise sur le stockage et accélère l’ensemble du processus.

C’est important pour savoir si de nouvelles données sont ajoutées ou si d’anciennes données sont en cours de mise à jour. L’index permet ainsi d’éviter des données en double qui occupent de l’espace et ne sont d’aucune utilité.

Méthodes d’indexation

Lorsqu’un index de moteur de recherche est en cours de construction, de nombreux types de structures de données sont également au choix.

Le choix d’une structure de données particulière pour un index s’assimile au choix d’un formulaire particulier pour une page Web. Cela dépend des facteurs que le moteur de recherche va fournir.

Ces structures de données peuvent être les suivantes.

  • Arbre de suffixe : il prend en charge la recherche de temps linéaire et il est structuré comme un arbre.
  • Arborescence : Structure de données arborescente ordonnée qui stocke un tableau associatif dans lequel les clés sont des chaînes.
  • Index inversé : stocke une liste d’occurrences sous la forme d’une table de hachage ou d’un arbre binaire.
  • Indice de citation : stocke des citations ou des liens hypertextes entre certains documents pour soutenir l’analyse de citations.
  • Ngram index : stocke des séquences de longueurs de données, qui supporte d’autres types de récupération. Parfois, supporte aussi le mini texte.
  • Matrice document temporaire : utilisée dans l’analyse sémantique latente. Une matrice de document temporaire stocke les occurrences de mots dans les documents dans une matrice creuse bidimensionnelle.

Le type le plus utilisé est « l’index inversé ». C’est là qu’intervient le mappage des mots à leur emplacement dans un document. C’est une « matrice clairsemée », car elle ne répertorie pas tous les mots de chaque document.

Un « index entièrement inversé » signifie que le mappage des mots s’effectue à leur emplacement dans les documents. Par ailleurs, le mappage touche aussi l’emplacement de chaque occurrence du mot.

Share This