in

Ce qui fonctionne et ce qui ne fonctionne pas


TF * IDF pour le référencement … selon qui vous parlez, c’est la chose la plus sur-médiatisée dans la recherche depuis la dernière chose sur-médiatisée dans la recherche ou c’est un excellent moyen de stimuler vos efforts de référencement.

Ce que je voudrais faire ici, c’est jeter un œil aux deux côtés de l’argument et vous montrer comment vous pouvez utiliser l’analyse TF * IDF à votre avantage de manière légitime … tout en mettant en évidence le nouvel outil TF * IDF de Rank Ranger!

Cela ressemble à un plan pour moi!

TF IDF pour la bannière SEO

Qu’est-ce que TF * IDF?

Commençons par la question la plus fondamentale de toutes, qu’est-ce que TF * IDF?

TF * IDF (terme fréquence * fréquence de document inverse), fondamentalement, n’a rien à voir avec le référencement ou les moteurs de recherche ou quoi d’autre. La construction, comme nous le savons à peu près maintenant, est venu de Karen Sparck Jones, un informaticien britannique, en 1972. Depuis lors, TF * IDF a été un élément fondamental de la recherche d’informations et de l’exploration de texte.

TF * IDF détermine la fréquence à laquelle un terme est utilisé dans un document (d’où TF ou fréquence du terme). Le problème évident est que dans presque tous les corpus de texte, les mots et, le, ou, Et similaires seront les termes les plus fréquemment utilisés et connaître leur fréquence est entièrement inutile.

Entrez l’IDF. La fréquence des termes inverses (IDF) réduit la valeur de mots comme et, le, ou, etc. Les mots qui apparaissent de manière volumineuse dans un document et dans d’autres documents seront réduits (ces mots étant et, le, ou, etc). Cet équilibre parfait entre TF et IDF nous laisse avec les mots les plus utilisés (et donc peut-être donc importants) sans la paille qui sont des mots comme et, le, ou, etc.

À des fins de référencement, TF * IDF pourrait indiquer la valeur ou l’importance d’un certain mot ou expression pour un moteur de recherche. Autrement dit, en analysant les meilleurs résultats pour une requête donnée, vous pourriez en théorie arriver aux mots les plus fréquemment utilisés et donc importants qui ne sont pas sont, le, ou, etc.

Vous pouvez voir où cela se dirige et pourquoi il y a une voix dans le monde du SEO qui réduit l’analyse TF * IDF.

TF * IDF est-il pertinent pour le référencement?

En ce qui concerne TF * IDF face au SEO, il y a un peu d’éléphant rose dans la pièce. Alors que de nombreux acteurs de l’industrie ont adopté l’idée d’utiliser TF * IDF pour déterminer la pertinence des mots clés, il y a également eu une forte voix de dissidence au sein de la communauté SEO.

Alors, qui a raison … ceux qui croient que TF * IDF est un « outil SEO » étonnant ou ceux qui pensent que TF * IDF est un groupe exagéré de ….?

Je vais vous tirer un cliché SEO en disant … ça dépend.

D’abord et avant tout … TF * IDF n’est pas un outil de référencement en soi. C’est une méthode utilisée par les moteurs de recherche pour analyser un document afin de voir quels libellés et concepts sont les plus importants pour ce document!

Non seulement cela, mais il est très probable, que Google est passé de TF * IDF en faveur de « pâturages plus avancés » via l’utilisation d’une variété de propriétés d’apprentissage automatique. En ce qui concerne le traitement du langage naturel (NLP), TF * IDF est un peu … basique (certainement par rapport à des choses comme BERT).

Bien sûr, utiliser un outil TF * IDF pour trouver le nombre magique de fois où vous devez utiliser un mot-clé sur une page spécifique est absurde. Cela dit, il existe un moyen réel d’utiliser une analyse basée sur TF * IDF à votre avantage, et c’est comme un outil de contenu. Si nous considérons TF * IDF comme un moyen d’élargir notre façon de voir nos choix terminologiques ou comme un moyen d’affiner l’identité de base d’une page ou même comme une méthode pour étudier les modèles de contenu d’un concurrent … TF * IDF est très utile .

Comment utiliser les données TF * IDF à l’ère moderne du référencement

Pour commencer, il ne s’agit pas du score en soi. Même si Google devait utiliser TF * IDF à ce stade du jeu, son corpus de documents s’étend d’ici à la lune. Tout ce que vous allez regarder est très limité et donc toute analyse que vous faites doit être nuancée. En d’autres termes, vous ne pouvez tout simplement pas brancher une URL et un mot-clé dans notre outil (ou tout autre outil de ce type) et utiliser les chiffres indiqués comme un «tout-en-un». Vous devez prendre les données affichées dans l’outil TF * IDF et ajouter une touche d’analyse qualitative pour qu’elles soient utiles (peu importe ce que quelqu’un d’autre vous dira).

Voici quelques méthodes de base, ainsi que des moyens plus créatifs, vous pouvez utiliser l’analyse TF * IDF pour véritablement booster vos efforts de référencement:

Évitez le bourrage de mots clés

C’est une façon évidente d’utiliser les informations d’un outil TF * IDF. Ses possible que la surutilisation d’un mot ou d’une phrase est ce qui se cache derrière l’incapacité d’une page à se classer ou à se classer aussi bien qu’elle pourrait en être autrement. Une analyse basée sur TF * IDF peut être utilisée pour identifier rapidement cette possibilité.

Prenez le site suivant pour le mot-clé alimentation et santé:

TF * IDF pour le bourrage de mots-clés

Dans ce cas, je ne serais peut-être pas trop préoccupé par l’utilisation excessive du terme régime. Il se pourrait simplement que la page fasse naturellement référence au mot au cours de son développement. Cela dit, le mot meilleur est l’un de ces termes clichés, sinon limites, qui pourraient rendre un moteur de recherche méfiant de la page si elle était surutilisée … comme elle semble être ici.

Encore une fois, vous ne pouvez pas simplement prendre les données d’un outil comme le nôtre et dire: «Oh, il y a du bourrage de mots clés ici.» Vous devez appliquer un peu le vieux cerveau. Pourtant, avoir une analyse TF * IDF peut rendre une telle évaluation beaucoup plus facile qu’elle ne le serait autrement.

Restez fidèle à l’identité de base de la page

L’un des principaux thèmes que j’ai vus émerger des principales mises à jour de Google sont les sites dont les identités contradictoires sont blessées dans le classement. En fait, l’un des modèles possibles que j’ai vus lors de la mise à jour de base de janvier 2020 était que les pages qui ne respectaient pas leur objectif principal pouvaient avoir subi une perte de classement. Autrement dit, les pages, en particulier les pages de destination, qui comprenaient du contenu qui ne correspondait pas à l’objectif principal de la page ou où l’alignement de ce contenu n’était pas facilement clair, ont souffert de la mise à jour. Dans d’autres mises à jour principales où Google pensait qu’il y avait un conflit dans l’identité d’un site, même au niveau linguistique granulaire, ces sites étaient négativement impactés.

Il n’est pas facile de savoir quand le contenu de votre page n’est pas totalement aligné sur son objectif principal. En fait, il n’y a aucun outil qui offrira directement cette information. Cependant, une analyse TF * IDF peut pointer vers de telles instances.

Prenez le mot-clé test d’allergie. Ici, le site de premier rang n’utilise pas du tout le terme allergologue, pas une seule fois. Et c’est parce qu’il n’y a vraiment aucune raison de le faire. Lorsque l’on parle de l’administration du test d’allergie, la page utilise le terme générique « médecin ». Cela a beaucoup de sens puisque l’auteur de la page n’a aucune idée du type de médecin qui peut administrer le test.

Alignement topique TF * IDF

En outre, toute référence à ceux qui administrent le test est entièrement naturelle et est discutée de manière assez «organique» dans le cadre du processus de test:

Site utilisant le langage naturel

En effet, c’est le modèle pour presque chaque page qui se classe sur la première page du SERP … médecin est utilisé sur allergologue.

Cependant, une page Web, le 5e résultat pour ce mot-clé a favorisé le terme allergologue.

TF * IDF montrant une utilisation non naturelle de la langue

En fait, ce site n’utilisait guère l’expression «docteur». Curieusement, ce site vous aide à trouver un allergologue. Ainsi, lorsque l’on discute des tests d’allergie, il privilégie non seulement le terme «allergologue» au lieu de «médecin», mais il l’étalage:

Exemple de langage de page non naturel

Le site utilise le terme «allergologue» pour promouvoir activement sa recherche.

C’est beaucoup d’analyse approfondie là-bas. TF * IDF m’a-t-il donné cela? Non. Mais sans cela, je n’aurais littéralement jamais compris pourquoi cette page pourrait ne pas être aussi bien classée que d’autres sur le SERP.

C’est tout à fait mon point … l’outil TF * IDF ne m’a pas donné la perspicacité … mais il m’a donné un accès facile à lui une fois que j’ai appliqué une analyse qualitative!

Développez votre stratégie de contenu

De toutes les façons d’utiliser une analyse TF * IDF de manière réaliste et percutante, la stratégie de contenu est la plus importante parmi elles. Il existe vraiment un ensemble diversifié de méthodes d’utilisation de TF * IDF pour affiner et propulser votre contenu et votre stratégie de contenu. De la recherche de mots clés dans le monde réel à l’analyse des concurrents, il y a vraiment trop de choses à couvrir ici. Avec cela, voici quelques façons d’utiliser TF * IDF du point de vue du contenu.

Savoir en quoi consiste un sujet et quels sujets couvrir

Savoir en quoi consiste un sujet, ses facettes et ses subtilités, semble être facile à découvrir. Rien qu’un petit brainstorming ne peut résoudre. Bien sûr, quiconque a réellement essayé de concrétiser clairement et en profondeur en quoi consiste un sujet sait que c’est tout un défi. Pour cela, nous nous appuyons souvent sur des outils de recherche de mots clés plus traditionnels qui sont excellents. Cependant, si vous voulez avoir un aperçu du monde réel de ce qui se passe dans un sujet, TF * IDF est votre ami.

En vous montrant quels termes sont utilisés parmi les pages les mieux classées, une analyse TF * IDF vous donne un aperçu de bonne foi de la façon dont les meilleurs sites abordent un sujet.

Prenez le mot-clé meilleures banques, une simple analyse TF * IDF nous donne une assez bonne ventilation de ce qui se passe dans le contenu qui prend la banque:

RF * IDF pour l'analyse topique

Si je devais créer du contenu autour de la recherche de la meilleure banque, je serais sage d’aborder la vérification, l’épargne, les taux d’intérêt, les frais, les services bancaires en ligne, etc. Bien sûr, il est prudent de regarder de plus près comment les meilleurs sites traitent ces sujets … un simple coup d’œil sur ce que produit une analyse TF * IDF permet de lancer un audit plus holistique.

Fermer les lacunes dans le contenu et enquêter sur les pratiques concurrentielles

Semblable à l’utilisation de TF * IDF pour étudier un sujet, vous pouvez utiliser le processus pour trouver les lacunes d’actualité que vous ne couvrez pas. Voici un exemple utilisant le mot-clé alarme:

TF * IDF pour la découverte de l'écart de contenu

Le site en question est un fournisseur d’alarme domestique et semble frapper tous les bons mots clés.

Cela dit, la page moyenne figurant sur la première page du SERP pour le mot clé inclut l’utilisation du terme «sans fil». Un aperçu rapide de ces sites montre qu’ils offrent une solution qui ne nécessite pas l’installation de panneaux d’alarme de sécurité mais utilise une certaine forme de solution sans fil.

En tant que tel, l’utilisation de TF * IDF nous permet non seulement de savoir quels aspects d’un sujet, ou dans ce cas un produit, nous ne pouvons pas présenter, mais c’est un moyen de suivre le contenu et les stratégies de produit de la concurrence!

Encore une fois, l’analyse de TF * IDF ne laisse pas tomber les réponses dans votre assiette d’un seul coup … mais avec des recherches plus approfondies, elle vous met sur la bonne voie sans trop d’effort.

Créez du contenu plus précis (et plus naturel)

Vous êtes censé créer un contenu qui semble naturel à la fois pour l’utilisateur et le moteur de recherche. Vous êtes également censé créer le contenu le plus nuancé, précis et précis possible. Je pense que nous le savons tous à ce stade. Cependant, comme tout écrivain le sait … plus facile à dire qu’à faire. La langue que vous utilisez et les mots que vous choisissez peuvent donner un ton approprié ou inapproprié à vos besoins. Un contenu plus formel peut s’appuyer sur des termes techniques, mais devrait le rappeler lorsque vous écrivez sur le même sujet pour une consommation de masse.

Le bon équilibre entre les termes techniques et le vernaculaire moins formel peut donner à votre contenu le bon ton. C’est très courant dans des secteurs comme la finance et la médecine. Prenez le mot-clé Médicaments contre la maladie d’Alzheimer par exemple. Si votre public est composé de professionnels des soins infirmiers, vous utiliserez un ensemble de termes différent de celui que vous pourriez utiliser lors de l’écriture pour la personne moyenne. Dans le cas où ce dernier est votre public cible, vous voudrez probablement vous assurer que vous offrez d’excellentes informations tout en les rendant aussi consommables que possible. Dans ce cas, l’exécution d’une analyse TF * IDF peut vous dire que vous pouvez équilibrer le terme très « froid » traitements avec un terme plus sensible et émotionnel comme se soucier:

TFIDF pour la diversité des termes

Réutiliser l’ancien contenu

Juste pour compléter les façons dont vous pouvez utiliser TF * IDF pour faire avancer votre stratégie de contenu … parlons de réaffecter l’ancien contenu. Ce que vous avez écrit il y a environ 10 ans, les facettes incluses, les termes que vous avez utilisés, etc. sont probablement un peu divergents par rapport à ce qui existe aujourd’hui. L’exécution de votre URL via une analyse TF * IDF peut vous aider à voir quels termes, sujets ou tout ce qui doit être mis à jour lorsque vous cherchez à réaffecter du contenu.

Ce n’est pas sorcier ou quoi que ce soit, mais utiliser TF * IDF de cette façon est un joli petit gain de temps qui peut vous orienter dans la bonne direction.

TF * IDF: certains assemblage requis

Vieux soudeur

L’idée que j’essaie de comprendre est que TF * IDF n’est pas une sorte d’outil de «haut niveau» pour obtenir une analyse rapide et facile. Ce n’est pas comment l’utiliser. C’est une façon très basique et à peu près non pertinente de regarder une analyse TF * IDF (pour la plupart).

Au contraire, ce que vous obtenez avec TF * IDF est une direction. Vous obtenez des signaux que vous pouvez utiliser pour commencer votre enquête. Vous obtenez les informations dont vous avez besoin pour savoir par où commencer, sur quoi regarder et comment procéder pour une sorte d’analyse plus qualitative.

La façon dont vous utilisez ces données va bien au-delà de ce que j’ai illustré ci-dessus. Tout dépend de ce que vous essayez d’accomplir, du site ou de la verticale que vous traitez, et bien plus encore. Le fil conducteur est qu’une analyse TF * IDF peut vous donner un aperçu plus «naturel» de l’apparence et du son du contenu réel du SERP.

Vous pouvez trouver l’outil Rank Ranger TF * IDF dans notre interface utilisateur sous: Rapports> Audit> Sur la page> Outil TF-IDF

A propos de l’auteur

Mordy Oberstein

Mordy est le CMO de Rank Ranger ainsi que l’hôte du podcast SEO In Search. Malgré ses nombreuses et vastes fonctions de marketing, Mordy se considère toujours comme un éducateur en référencement avant tout. C’est pourquoi vous le trouverez publier régulièrement toutes sortes de recherches et d’analyses SEO originales!



What do you think?

0 points
Upvote Downvote

Written by manuboss

Comment créer un profil de backlink sûr – Entretien avec un ancien googleur

Qu’est-ce qu’un lien sortant