Clustering : Définition

Le clustering expliqué avec un choix

En matière de recherche de l’information, le Clustering c’est lorsque les moteurs de recherche classent un site ou un page web dans des clusters différents. Ce terme désigne aussi le fait que les moteurs de recherche limitent le nombre de liens pour un même site web dans leurs SERP.

Par Clusters ici, il faut comprendre thématiques notamment la politique, le sport, la santé, etc.

La catégorisation de l’information avec le Clustering

Le sens premier du terme Clustering est le fait de diviser les informations en catégories en fonction des thèmes. Ainsi, une page web peut faire partie de plusieurs clusters différents. C’est ce qui donne la possibilité au moteur de recherche de renvoyer des résultats qui ne prêtent pas à équivoque.

Cela arrive pour les termes qui ont plusieurs sens comme par exemple le mot avocat qui renvoie en même temps à un fruit et à un métier.

C’est aussi le cas du mot orange qui renvoie à un fruit, une couleur et même une entreprise. Et les exemples similaires sont nombreux. Ainsi, une page dont le contenu traite d’un sujet sur le fruit « orange » est placée dans le Cluster qui correspond à sa thématique.

Celle-ci ne va pas apparaitre dans les résultats du moteur à propos d’une requête relative à des couleurs de peintures artistiques.

Tous les moteurs de recherche s’appuient sur les algorithmes de Clustering pour fonctionner.

La limitation du nombre de liens dans les pages de résultats des moteurs de recherche

C’est l’autre sens du mot Clustering qui renvoie à la restriction du nombre de lien affichés dans une page de résultat de recherche pour un même site web.

Google a souvent utilisé le Clustering dans ses résultats pour renvoyer au maximum 2 liens pour un site donné. Le second lien était décalé vers la droite, avec un lien de type « Autres résultats » qui donnait la possibilité de consulter d’autres pages pertinentes du site liées à la même requête.

Mais depuis quelques temps, le moteur de recherche a revu sa stratégie. Après être passé à 3 liens, désormais il ne fixe plus de limite, et encore moins n’indente les résultats comme c’était le cas auparavant.

De nos jours, il n’est donc pas surprenant de voir un même site web s’afficher dans les 10 « liens bleus » de la SERP. Toutefois, dans le but de fournir divers résultats à l’internaute, l’algorithme veille attentivement à ce que cette situation se produise le moins souvent possible.