in

Des documents Google ont été divulgués et les référenceurs font des hypothèses farfelues


Vous avez probablement entendu parler de la récente fuite de documents Google. C'est sur tous les sites majeurs et sur tous les réseaux sociaux.

D'où viennent les documents ?

Je crois comprendre qu'un robot appelé yoshi-code-bot a divulgué des documents liés à Content API Warehouse sur Github le 13 mars 2024. Il est peut-être apparu plus tôt dans d'autres dépôts, mais c'est celui qui a été découvert pour la première fois.

Ils ont été découverts par Erfan Azimi avec qui l'a partagé Rand Fishkin avec qui l'a partagé Mike Roi. Les documents ont été supprimés le 7 mai.

J'apprécie toutes les personnes impliquées pour avoir partagé leurs découvertes avec la communauté.

La réponse de Google

Il y a eu un débat quant à savoir si les documents étaient réels ou non, mais ils mentionnent de nombreux systèmes internes et renvoient à la documentation interne et cela semble définitivement réel.

Un porte-parole de Google a publié la déclaration suivante à Terre des moteurs de recherche:

Nous vous déconseillons de formuler des hypothèses inexactes sur la recherche basée sur des informations hors contexte, obsolètes ou incomplètes. Nous avons partagé de nombreuses informations sur le fonctionnement de la recherche et les types de facteurs pris en compte par nos systèmes, tout en nous efforçant de protéger l'intégrité de nos résultats contre toute manipulation.

Les référenceurs interprètent les choses en fonction de leurs propres expériences et préjugés

De nombreux référenceurs affirment que les facteurs de classement ont été divulgués. Je n'ai vu aucun code ni poids, juste ce qui semble être des descriptions et des informations de stockage. À moins que l'une des descriptions n'indique que l'élément est utilisé pour le classement, je pense qu'il est dangereux pour les référenceurs que tous ces éléments soient utilisés dans le classement.

Le fait de stocker certaines fonctionnalités ou informations ne signifie pas qu'elles sont utilisées dans le classement. Pour notre moteur de recherche, Oui.com, nous stockons toutes sortes d'éléments qui peuvent être utilisés à des fins d'exploration, d'indexation, de classement, de personnalisation, de tests ou de commentaires. Nous avons même stocké des choses avec lesquelles nous ne faisons pas encore quelque chose.

Ce qui est plus probable, c'est que les référenceurs font des hypothèses qui favorisent leurs propres opinions et préjugés.

C'est la même chose pour moi. Je n'ai peut-être pas un contexte ou des connaissances complets et je peux avoir des préjugés inhérents qui influencent mon interprétation, mais j'essaie d'être aussi juste que possible. Si je me trompe, cela veut dire que je vais apprendre quelque chose de nouveau et c'est une bonne chose ! Les référenceurs peuvent interpréter les choses différemment, et le font effectivement.

Gaël Breton je l'ai bien dit :

Je suis là depuis assez longtemps pour voir de nombreux mythes sur le référencement créés au fil des ans et je peux vous indiquer qui a lancé bon nombre d'entre eux et ce qu'ils ont mal compris. Nous verrons probablement beaucoup de nouveaux mythes issus de cette fuite auxquels nous serons confrontés au cours de la prochaine décennie ou plus.

Examinons quelques éléments qui, à mon avis, sont mal interprétés ou pour lesquels des conclusions sont tirées là où elles ne devraient pas être.

Autorité du site

Même si je veux pouvoir dire que Google a un score d'autorité de site qu'il utilise pour le classement qui ressemble à DR, cette partie concerne spécifiquement les mesures de qualité compressées et parle de qualité.

Je pense que la DR est davantage un effet qui se produit lorsque vous avez beaucoup de pages avec un PageRank fort, pas que ce soit nécessairement quelque chose que Google utilise. De nombreuses pages avec un PageRank plus élevé et des liens internes les unes avec les autres signifient que vous êtes plus susceptible de créer des pages plus solides.

  • Est-ce que je crois que le PageRank pourrait faire partie de ce que Google appelle la qualité ? Oui.
  • Est-ce que je pense que c'est tout ? Non.
  • L'autorité du site pourrait-elle être quelque chose de similaire à DR ? Peut être. Cela s’inscrit dans une vision plus large.
  • Puis-je prouver cela ou même qu'il est utilisé dans les classements ? Non, pas de ça.

D'après certains témoignages de Google auprès du ministère américain de la Justice, nous avons découvert que la qualité est souvent mesurée à l'aide d'un score de satisfaction informationnelle (IS) attribué par les évaluateurs. Ceci n'est pas directement utilisé dans les classements, mais est utilisé pour les commentaires, les tests et l'ajustement des modèles.

Nous savons que les évaluateurs de qualité ont le concept d'EEAT, mais encore une fois, ce n'est pas exactement ce que Google utilise. Ils utilisent des signaux qui s’alignent sur EEAT.

Certains des signaux EEAT mentionnés par Google sont :

  • Classement
  • Mentions sur des sites faisant autorité
  • Requêtes sur les sites. Il peut s'agir de « site :http://ahrefs.com EEAT » ou de recherches telles que « ahrefs EEAT »

Alors, une sorte de score PageRank extrapolé au niveau du domaine et appelé Site Authority pourrait-il être utilisé par Google et faire partie de ce qui constitue les signaux de qualité ? Je dirais que c'est plausible, mais cette fuite ne le prouve pas.

Je me souviens de 3 brevets de Google que j'ai vus concernant les scores de qualité. L'un d'eux s'aligne sur les signaux ci-dessus pour les requêtes sur le site.

Je dois souligner que ce n’est pas parce qu’une chose est brevetée qu’elle est utilisée. Le brevet autour des requêtes du site a été écrit en partie par Navneet Panda. Vous voulez deviner de qui l’algorithme Panda lié à la qualité doit son nom ? Je dirais qu'il y a de fortes chances que cela soit utilisé.

Les autres concernaient l'utilisation de n-gram et semblaient consister à calculer un score de qualité pour un nouveau site Web et un autre temps mentionné sur le site.

bac à sable

Je pense que cela a également été mal interprété. Le document comporte un champ appelé hostAge et fait référence à un bac à sable, mais il indique spécifiquement qu'il est utilisé « pour mettre en bac à sable les nouveaux spams pendant la durée de diffusion ».

Pour moi, cela ne confirme pas l'existence d'un bac à sable tel que le voient les référenceurs là où les nouveaux sites ne peuvent pas être classés. Pour moi, cela ressemble à une mesure de protection contre le spam.

Clics

Les clics sont-ils utilisés dans les classements ? Eh bien, oui et non.

Nous savons que Google utilise les clics pour des choses telles que la personnalisation, les événements ponctuels, les tests, les commentaires, etc. Nous savons qu'ils ont des modèles sur des modèles formés sur les données de clic, y compris navBoost. Mais est-ce que cela accède directement aux données de clic et est utilisé dans les classements ? Rien de ce que j'ai vu ne le confirme.

Le problème est que les référenceurs interprètent cela comme étant un facteur de classement. Navboost est conçu pour prédire sur quelles pages et fonctionnalités seront cliquées. Il est également utilisé pour réduire le nombre de résultats renvoyés, ce que nous avons appris de l'essai du DOJ.

Pour autant que je sache, rien ne confirme qu'il prend en compte les données de clics de pages individuelles pour réorganiser les résultats ou que si vous incitez plus de personnes à cliquer sur vos résultats individuels, votre classement augmentera.

Cela devrait être assez facile à prouver si c'était le cas. Cela a été essayé à plusieurs reprises. Je l'ai essayé il y a des années en utilisant le réseau Tor. Mon ami Russ Jones (qu'il repose en paix) a essayé d'utiliser des procurations résidentielles.

Je n'ai jamais vu de version réussie de cela et les gens achètent et échangent des clics sur différents sites depuis des années. Je n'essaie pas de vous décourager ou quoi que ce soit. Testez-le vous-même et si cela fonctionne, publiez l'étude.

Les tests de Rand Fishkin pour rechercher et cliquer sur un résultat lors de conférences il y a des années ont montré que Google utilisait les données de clic pour les événements de tendance, et qu'elles amélioreraient le résultat sur lequel on clique. Après les expériences, les résultats sont revenus à la normale. Ce n'est pas la même chose que de les utiliser pour le classement normal.

Auteurs

Nous savons que Google associe les auteurs aux entités du graphe de connaissances et qu'ils les utilisent dans les actualités Google.

Il semble y avoir une quantité décente d'informations sur l'auteur dans ces documents, mais rien à leur sujet ne confirme qu'ils sont utilisés dans les classements, comme le spéculent certains référenceurs.

Google nous a-t-il menti ?

Ce avec quoi je suis totalement en désaccord, c'est que les référenceurs sont en colère contre les Google Search Advocates et les traitent de menteurs. Ce sont des gens sympas qui font juste leur travail.

S'ils nous ont dit quelque chose de mal, c'est probablement parce qu'ils ne le savent pas, qu'ils ont été mal informés ou qu'on leur a demandé de dissimuler quelque chose pour éviter les abus. Ils ne méritent pas la haine que leur voue actuellement la communauté SEO. Nous avons de la chance qu'ils partagent des informations avec nous.

Si vous pensez que quelque chose qu’ils ont dit est faux, faites un test pour le prouver. Ou si vous souhaitez que je fasse un test, faites-le-moi savoir. Le simple fait d'être mentionné dans la documentation ne prouve pas qu'un objet est utilisé dans les classements.

Dernières pensées

Même si je peux être d'accord ou en désaccord avec les interprétations des autres référenceurs, je respecte tous ceux qui sont prêts à partager leur analyse. Il n’est pas facile de soumettre vous-même ou vos pensées à l’examen du public.

Je tiens également à réitérer qu'à moins que ces champs n'indiquent spécifiquement qu'ils sont utilisés dans les classements, les informations pourraient tout aussi bien être utilisées pour autre chose. Nous n'avons certainement pas besoin d'articles sur les 14 000 facteurs de classement de Google.

Si vous voulez mon avis sur une chose en particulier, envoyez-moi un message X ou LinkedIn.



What do you think?

0 points
Upvote Downvote

Written by manuboss

Guide du débutant sur les pages de destination des tests A/B

Rupture : fuite des secrets du classement Google ! Qu'est-ce qui a été trouvé ?