in

Algorithme PageRank de Google et évaluation de l’autorité du site Web


29 juin 2021 | 13 minutes de lecture

Le Web tel que nous le connaissons aujourd’hui n’avait pas le même aspect à ses débuts. L’autorité des pages Web basée sur des liens pointant vers elles est désormais perçue comme la norme. Mais c’était révolutionnaire en 1998, lorsque Google a introduit l’algorithme PageRank pour faire de l’évaluation des liens sortants un facteur de classement valide. Alors que le PageRank a certainement joué un rôle crucial dans l’évolution du référencement et de ses techniques, il n’est pas clair si cela a toujours de l’importance après 2018, lorsque le brevet d’origine a expiré. Dans cet article, nous examinerons l’historique du PageRank, expliquerons comment il est calculé et découvrirons s’il est toujours appliqué aux classements.

Qu’est-ce que le PageRank

Le PageRank est un algorithme de classement des pages Web en fonction du nombre et de la qualité des liens qui y pointent. Il a été développé par les ingénieurs pionniers de Google Larry Page et Sergey Brin en 1998 et a marqué la première tentative réussie d’un moteur de recherche pour évaluer le niveau d’autorité d’une page Web donnée. Fondamentalement, cela signifiait qu’une page obtiendrait un classement plus élevé avec plus de backlinks.

Comme l’expliquent les ingénieurs dans le papier original, PageRank visait à « mettre de l’ordre sur le Web » en répartissant les poids sur les pages. Ils ont construit l’algorithme sur l’idée d’un internaute aléatoire qui visite une page et accède à d’autres pages en cliquant sur des liens. La probabilité qu’un internaute au hasard atteigne une certaine page est le PageRank de cette page. Le score est calculé sur la base d’une échelle logarithmique comprise entre 0 et 10, où 10 représente la source Web la plus fiable qui soit.

Le principe du PageRank

Le PageRank est une mesure objective qui correspond aux intentions subjectives des internautes : plus il y a de sources pointant vers une page, plus les informations sur cette page sont précieuses et plus les utilisateurs sont susceptibles de la visiter. Mais les sources de référence ne sont pas égales – le nombre de pages qui y renvoient est également mesuré : plus une page de référence a de backlinks, plus elle transmet de puissance PageRank sur une page à laquelle elle renvoie. Explorons-le plus en détail.

Comment c’est calculé

Voici la formule originale du PageRank :

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

  • UNE est la page analysée
  • T1…Tn sont les pages pointant vers la page analysée
  • C est le nombre de liens placés sur la page analysée
  • est un facteur d’amortissement qui correspond à la probabilité qu’un utilisateur abandonne une page (généralement fixé à 0,85)

Lorsque les pages votent sur d’autres pages en les citant, elles distribuent leur PageRank. Par exemple, la page A a un score de PageRank de 5 et elle renvoie aux pages B et C. Indépendamment des autres liens que les pages B et C pourraient avoir, les pages B et C reçoivent 85 % du score de la page A (4,25) combiné (le score multiplié par le facteur d’amortissement). Si la page B cite la page D, le score PageRank de D inclura 85 % du score de B, et ainsi de suite.

Exemple de calcul de PageRank

Examinons un exemple simple de distribution PageRank faite avec un Simulateur de PageRank:

Exemple de distribution de PageRank

La page 3 a ici le score de PageRank le plus élevé car elle est liée au plus grand nombre. Et parce que la page 3 a le score le plus élevé, le PageRank qu’il transmet aux pages 4 et 5 est également plus élevé. Naturellement, ce calcul est effectué indépendamment d’un scénario réel, en supposant que seules ces 5 pages existent sur le Web, mais il montre, de manière simplifiée, comment la valeur du PageRank est répartie sur les pages Web.

Le PageRank étant une métrique d’autorité, la puissance transmise par les liens est calculée de manière hiérarchique : une citation d’une page PageRank 8 pèse plus qu’une citation d’une page PageRank 2. Mais votre page peut obtenir une valeur PageRank plus élevée grâce à des liens provenant de pages faisant moins autorité si elles utilisent généralement moins de citations. Disons que votre page est référencée à partir d’une source PageRank 7 qui contient 10 liens sortants et également à partir d’une source PageRank 3 qui ne contient que 3 liens. La première source passera le PageRank de 0,105 (0,7 multiplié par le facteur d’amortissement) et la seconde apportera votre page 0,15. Cependant, les pages populaires et de haute qualité ne renvoient généralement pas à de nombreuses autres pages, il est donc toujours préférable de se concentrer sur l’obtention de backlinks à partir des sites les plus fiables.

La valeur du PageRank est basée sur le nombre de liens sortants

Barre d’outils PageRank et manipulation des liens

En 2000, Google a rendu le score PageRank de n’importe quel site Web visible publiquement sur la barre d’outils du navigateur. Une telle exposition a conduit à des manipulations de classement appelées sculpture de PageRank : les propriétaires de sites Web et les référenceurs se concentraient sur l’obtention de plus de liens à partir de pages à haut score et des fermes de liens entières sont apparues pour aider les gens à acheter les liens. Une telle compréhension de l’algorithme, qui consistait à obtenir autant de liens que possible à partir de pages avec un score aussi élevé que possible sans tenir compte du contexte des liens et de nombreux autres aspects, n’était pas une pratique de référencement durable.

Google a fait différentes tentatives pour arrêter les manipulations de classement avec le PageRank et a finalement cessé la barre d’outils en 2016. On peut encore voir des services en ligne qui calculent le score du PageRank et proposent des badges PageRank à mettre sur les sites Web, même s’il s’agit d’une pratique complètement dépassée. L’algorithme est toujours utilisé dans les classements de Google, mais il n’y a aucun moyen de trouver des calculs officiels accessibles au public.

L’attribut nofollow

Les techniques de manipulation de liens n’étaient pas uniquement liées à la barre d’outils PageRank destinée au public. Pour résoudre le problème du spam dans les commentaires, Google, en collaboration avec d’autres moteurs de recherche majeurs, a introduit le pas de suivi attribut en 2005. Cet attribut indique aux robots de recherche de ne pas suivre un lien et empêche la distribution d’équité de lien. Avant que pas de suivi, les internautes pourraient inonder Internet de commentaires mentionnant l’adresse de leur site Web et augmenter le score de PageRank.

Ce nouvel attribut a stimulé de nouvelles pratiques de manipulation de liens. Étant donné que le poids que le PageRank transmet aux pages liées dépend de leur nombre – plus une page a de liens, moins la partie du PageRank de cette page est distribuée – les SEO utiliseraient pas de suivi pour diriger le flux de PageRank et passer plus de poids via les liens suivis.

Disons qu’une source avec un score de PageRank de 5 a cité 10 autres pages et a marqué 8 de toutes les citations comme nofollow. Avant que pas de suivi, cela signifierait que chaque page citée a obtenu un dixième du score de la page de référence (0,425 en ce qui concerne le facteur d’amortissement). Avec pas de suivi, seules 2 pages suivies recevraient chacune la moitié du PageRank de la page de référence (2,125). Comme il s’agissait d’une technique de manipulation, le la situation a changé en 2009: dans le même scénario, deux pages suivies recevraient le PageRank de 0,425 au lieu de 2,125. Ainsi, le PageRank est réparti de manière égale sur tous les liens d’une page, mais n’est en fait transmis qu’à travers les liens marqués par poursuivre.

L’attribut UGC

Comparés aux liens sortants pertinents placés naturellement, les liens de commentaires ne sont le plus souvent pas aussi fiables et il n’est pas juste de leur accorder le même crédit. En 2019, Google a ajouté un nouveau type d’attribut spécialement conçu pour les liens de commentaires : UGC (user-generated content). Désormais, de nombreux blogs et forums définissent automatiquement tous les liens placés dans la section des commentaires vers UGC, tandis que pas de suivi est utilisé à des fins plus larges.

L’algorithme mis à jour

En 2004, Google a publié le brevet PageRank mis à jour basé sur un «modèle de surfeur raisonnable” où ils ont introduit l’idée que les liens peuvent avoir des valeurs différentes en fonction de leur potentiel de clic. Par exemple, les liens placés en haut de la page ou les liens avec des textes d’ancrage informatifs suffisamment longs sont généralement plus visibles et attrayants pour les utilisateurs. À partir de ce moment, la probabilité d’être cliqué a été prise en compte pour évaluer l’autorité et servir les classements.

En 2006, Google a conçu un nouveau système qui sélectionne quelques sources de confiance appelées pages de départ et évalue la qualité des autres pages en fonction des liens provenant des pages de départ. C’était une réponse au PageRank étant vulnérable aux manipulations, et la nouvelle formule ressemblait à ceci :

∀si ≠ p ∈ P, Ri⁡(p) = d⁢ ∑ q→p⁢ Ri⁡(q) / qout ⁢* w(q→p)

  • sje sont des pages de semences de haute qualité
  • P représente toutes les pages Web
  • qen dehors est le degré de sortie d’une page q
  • w est un poids du lien (mis à 1 par défaut)

Google cite le New York Times comme un bon exemple de page de départ, car elle est suffisamment diversifiée pour couvrir un large éventail de sujets qui intéressent les utilisateurs et propose de nombreux liens sortants utiles. Les pages citées par les graines sont également considérées comme de haute qualité, et plus il est facile d’atteindre une page à partir d’une graine, plus elle est fiable et plus elle a un score élevé.

Selon ce brevet mis à jour, le processus de distribution de classement basé sur des liens passe par les étapes suivantes :

  • Le système reçoit un ensemble de pages ouvertes pour être indexées et classées
  • Le système connaît un ensemble de pages de départ qui renvoient vers d’autres pages
  • Le système calcule à quelle distance des graines se trouvent les pages analysées en fonction des liens entre elles
  • Le système détermine les classements en fonction des distances les plus courtes jusqu’aux pages de départ

Ce nouvel algorithme qui a remplacé la formule PageRank d’origine est plus rapide à calculer car il ne progresse plus d’une itération à l’autre. Et même si le brevet PageRank d’origine a expiré en 2018, cela ne signifie pas que Google ne l’utilise toujours pas. Répondant à un tweet sur l’autorité, l’analyste de Google John Mueller a admis avoir utilisé le PageRank “parmi beaucoup d’autres signaux.”

Facteurs qui influencent le PageRank

Comme nous l’avons mentionné, différents aspects du lien affectent le score de PageRank :

  • Le nombre de liens
  • Attributs de lien
  • Texte d’ancrage
  • La probabilité d’être cliqué

Voyons comment tirer le meilleur parti des liens que vous placez et de ceux que vous acquérez.

Optimiser le flux des capitaux propres du lien

Obtenir des backlinks pour voter en faveur de votre site Web est toujours l’une des choses les plus importantes pour établir l’autorité sur le Web. Les liens transmettent l’équité des liens aux pages qu’ils citent sous certaines conditions :

  • Quand ils sont pertinents. La pertinence est la clé du référencement à bien des égards. Google n’aime pas que les pages soient liées de manière aléatoire. Supposons que votre page contenant une recette de cuisine obtienne des liens à partir de pages sur les voitures. Quelle que soit la fiabilité de la source externe, ce type de lien n’améliorera pas le classement de votre page.
  • Quand ils ont un texte d’ancrage naturel. Les textes d’ancrage dénués de sens comme « cliquez ici » ou ceux suroptimisés qui contiennent des mots-clés cibles ne sont pas bons pour établir la pertinence. Le texte d’ancrage doit décrire le sujet de la source liée et servir d’indice pour expliquer pourquoi un utilisateur doit suivre le lien.
  • Quand les sites dont ils proviennent sont dignes de confiance. Il est important de vérifier la qualité du domaine et de la page des sources pour obtenir des backlinks et surveiller les liens nuisibles provenant de sources de mauvaise qualité.
  • Quand ils sont rampables. Les liens sont importants si les robots de recherche peuvent les trouver et s’ils ne sont pas bloqués dans robots.txt ou par d’autres méthodes.
  • Quand ils ne déclenchent pas de réponse d’erreur du serveur. Les pages liées et les liens doivent être ouverts pour l’indexation. De plus, aucune redirection ne peut transmettre l’intégralité de l’équité du lien : même si Google a déclaré que tous les types de redirections passent le PageRank, les SEO pensent que ce n’est peut-être pas le cas avec les redirections non-301.
  • Quand ils sont suivis. Nous avons déjà discuté de la façon dont le pas de suivi L’attribut influence la distribution du pouvoir de classement : si votre page est citée mais non suivie, cela ne vous apportera pas beaucoup d’avantages en termes de classement.
  • Quand ils sont visibles sur une page. Les liens cachés peuvent entraîner des pénalités, et plus les liens sont visibles, mieux c’est pour l’UX et le référencement. Cela ne signifie pas que les liens doivent se démarquer nettement : ils doivent être facilement distinguables mais conçus avec des principes communs de visualisation de liens.

Étant donné que PageRank évalue l’autorité sur une page et non sur une base de site, les liens internes sont aussi importants que les backlinks. Avec un maillage interne approprié, vous pouvez distribuer le flux de liens :

  • Plus une page a de liens internes, plus son PageRank est élevé
  • Plus il y a de liens placés sur une page, moins ils transmettent de valeur PageRank
  • Les liens facilement cliquables passent un PageRank plus élevé
  • Liens attribués par pas de suivi ne passez aucun PageRank

En parlant de liens externes, ils n’ont pas d’impact sur le score PageRank des pages sur lesquelles ils sont placés. Ils servent de signaux de pertinence et aident Google à établir des connexions entre différentes sources, mais ils n’influencent pas directement les classements des moteurs de recherche.

Autres mesures d’autorité

Le PageRank a été la première mesure d’autorité à influencer les pratiques Web et SEO. Il est toujours utilisé parmi les signaux de classement de Google même si on ne sait pas exactement comment. Il est sûr de dire que les liens pertinents provenant de sources de haute qualité sont cruciaux pour les classements et l’établissement de l’autorité.

D’autres mesures de référencement visant à évaluer l’autorité du site Web tournent également autour de la quantité et de la qualité des backlinks. Alexa Rank d’Amazon diffère de ce paradigme car il évalue le trafic du site Web et l’engagement des visiteurs, mais les paramètres de qualité développés par les plateformes de référencement se concentrent sur le profil de backlink.

Par exemple, la confiance de domaine et la confiance de page de SE Ranking sont des scores agrégés de qualité de domaine et de page basés sur le nombre et la qualité des backlinks et des domaines de référence. Vous pouvez vous faire une idée de la qualité d’un site Web en exécutant son analyse dans le Recherche concurrentielle outil:

Métriques d'autorité du classement SE Trust de domaine et confiance de page

Les données DT et PT sont également disponibles dans le Vérificateur de backlink et Moniteur de backlink outil, et le score DT est présent dans le Audit de site Web‘s aperçu parmi d’autres métriques de domaine majeures.

Alors, avez-vous besoin de vous soucier du PageRank ?

La valeur des liens a jeté les bases de la formule de classement de Google. Indépendamment des changements dans l’algorithme de PageRank et de son importance, les liens ont toujours été et seront probablement un facteur de classement majeur. Dans un Q&R 2016, les représentants de Google ont révélé que le contenu et les liens sont les deux principaux facteurs influençant les classements, et dans la discussion Twitter 2020 que nous avons déjà mentionnée, John Mueller a admis que le PageRank compte toujours pour les classements.

Cela signifie que vous devez prioriser le travail sur un profil de backlink sécurisé et peaufiner vos liens internes de temps en temps. Comme Moz Rand Fishkin le dit, quelle que soit l’ancienneté des théories du PageRank, cela ne fera pas de mal de vérifier vos liens et d’éliminer ceux qui sont inutiles. Assurez-vous que la structure de votre site Web permet de naviguer facilement à travers différentes pages et d’établir des relations de backlink avec des sources faisant autorité qui sont pertinentes pour les sujets que vous ciblez.

Affichages des publications : 73



What do you think?

0 points
Upvote Downvote

Written by manuboss

Quel est le meilleur CMS pour le référencement en 2021 ? (Réponse basée sur les données)

Suivi des pixels et visibilité SERP