Depuis ce matin, ça danse sur les Data Centers de Google. La première mise à jour du Page Rank de l’année 2008 semble bien être en cours.
Et je gage que mêmes ceux qui clament haut et fort que "le PR, ça ne sert à rien" sont comme les autres en train de surveiller l’évolution de la petite barre verte sur leurs sites.
A moins que vous n’ayez passé ces 4 dernières années sur un radeau au milieu de l’Atlantique, ou en Antartique à observer les manchots empereurs, vous avez sans doute lu ou entendu dire que pour bien se positionner sur les pages de résultats de Google, il était important d’avoir des liens entrants (backlinks ou BL pour les intimes) provenant de sites ayant une thématique similaire à la votre.
Malheureusement, ça n’est pas aussi simple que ça : pour bien se positionner, il est important de comprendre comment Google détermine la thématique d’un site, ou plutôt comment il évalue la pertinence du contenu d’une page par rapport à une requête donnée. C’est la fonction de l’algorithme Hilltop.
Début novembre 2003, les data centers de Google commencent à s’agiter et la petite barre verte du PR se grise pour de nombreux sites : c’est le début d’une nouvelle Google Dance, et jusque là, il n’y a rien d’anormal. Mais 2 semaines plus tard, à la fin de cette mise à jour qui restera dans les mémoires sous le nom de Florida Update, de nombreux sites commerciaux qui s’étaient arrogé des places de choix dans les SERPs de Google dégringolent et se retrouvent rélegués au fin fond du classement sur leurs mots-clés cibles.
|
En pleine période d’achats de Noël, la surprise est amère et aussitôt, dans tous les forums SEO, les gourous y vont chacun de leur hypothèse pour expliquer ce changement brutal. Certains évoquent une pénalité pour sur-optimisation du contenu, d’autres annoncent que Google a décidé de ne plus prendre en compte les liens réciproques. D’autres encore y voient une manoeuvre pour forcer les sites commerciaux à utiliser Adwords. |
La vérité est ailleurs : Google vient de mettre en oeuvre l’algorithme Hilltop, acquis quelques mois plus tôt, afin de présenter aux internautes des résultats plus pertinents par rapports à leurs requêtes.
En 1999, Krishna Bharat (alors ingénieur au centre de recherche Compaq de Palo Alto) et George Mihaila (chercheur au département des sciences de l’information de l’Université de Toronto) déposent le brevet d’un algorithme censé améliorer la pertinence des résultats par rapport aux mots-clé d’une requête.
Voici, simplifié par mes soins, la description du fonctionnement de leur algorithme, extraite de ce document de référence.
L’algorithme Hilltop se décompose en deux phases, qui sont effectuées à chaque fois qu’une requête est lancée.
Identification des pages expertes : une page experte est une page traitant d’un sujet particulier et comportant de nombreux liens vers des pages non-affiliées traitant du même sujet.
« Deux pages sont dites non-affiliées si elles résident sur des serveurs de classes C différentes (3 premiers octets de l’adresse IP). » et dans des domaines différents.
L’identification des pages expertes est faite dans un index spécialisé, qui est un sous-ensemble de l’index général du moteur.
Classement des pages cibles : chaque lien venant de pages expertes non-affiliées confère à une page cible un certain degré d’autorité relatif à la requête. Plus le degré d’autorité est élevé, plus la page est considérée comme pertinente pour une requête donnée, et mieux la page en question sera classée dans les resultats de recherche sur cette requête spécifique.
Fin 1999, Krishna Bharat rejoint Google, et occupe depuis lors la position de scientifique principal.
En 2003, Google acquiert le brevet de l’algorithme Hilltop, et ça n’est pas pour en faire des confitures : la mise en oeuvre commence dès la Google Dance de Mars 2003, pour être complètement opérationnelle dès Novembre 2003.
Aujourd’hui, l’algorithme Hilltop a sans doute été beaucoup affiné mais ses principes de fonctionnement restent d’actualité et ont un poids non négligeable dans le classement des pages de résultats de recherche....sur un grand nombre de requêtes très concurrentielles.
La conception même de l’algorithme impose la création d’un index inversé (requête ==> pages expertes), ce qui empêche de généraliser son emploi à l’ensemble des requêtes possibles.
En terme de positionnement, il y a deux façons possible d’optimiser ses pages :
essayer de se positionner sur de nombreuses requêtes non-concurrentielles (être en première pages sur 30 requêtes non concurrentielles peut s’avérer plus rentable que d’être en 2ème ou 3ème page sur une seule requête très concurrentielle).
essayer de référencer ses pages pour être bien évalué par l’algorithme Hilltop : déterminer quelles sont les pages expertes pour la requête qui nous intéresse. Cela peut se faire par l’analyse des backlinks des concurrents : quelles sont les pages expertes qui pointent vers eux, et essayer d’obtenir un lien de ces mêmes pages.
D’après la descriptions qu’en donne le brevet de l’algorithme, ces pages expertes ont de fortes chances d’être des pages de même thématique dans un annuaire de qualité ou des Hub Pages.
A vous de les repérer....ou de créer les votres