in

Pourquoi les marques en dépendent et pourquoi cela ne fonctionne pas


Expert SEO et marketing de contenu chez SE Ranking, spécialisé dans la recherche industrielle autour des tendances SEO et IA.

Révisé par

Svitlana Tomko

Analyste de recherche SEO spécialisé dans l’analyse SEO basée sur les données, les expériences et les études industrielles.

En 2025, les propriétaires de sites Web et les spécialistes du marketing subissent une pression croissante pour s’assurer que leur contenu est visible pour les systèmes d’IA. LLMs.txt promet une solution simple : un fichier unique qui pointe les modèles vers vos pages les plus importantes.

Cela semble prometteur. Mais est-ce que cela fait réellement une différence ?

Nous avons analysé 300 000 domaines pour le savoir. Voici ce que montrent nos données.

  • LLMs.txt est un « AI robots.txt » récemment proposé.

    Il s'agit d'un fichier simple conçu pour mettre en évidence le contenu le plus important d'un site Web pour les LLM. L’objectif est d’aider les systèmes d’IA à trouver, interpréter et citer plus facilement les pages clés d’un site.

  • Seulement environ 1 site Web sur 10 utilise LLMs.txt.

    Dans notre ensemble de données de près de 300 000 domaines, seulement 10,13 % disposaient d'un fichier LLMs.txt. On est loin de l’adoption universelle de standards comme les robots.txt ou les sitemaps.

  • Il n'y a aucune corrélation entre les citations AI et LLMs.txt.

    L'analyse statistique et l'apprentissage automatique n'ont montré aucun effet de LLMs.txt sur la fréquence à laquelle un domaine est cité par les LLM. La suppression de cette variable de notre modèle XGBoost a en fait amélioré sa précision. Cela signifie que LLMs.txt pourrait actuellement introduire plus de bruit que de valeur.

Qu'est-ce que le fichier LLMs.txt ?

Alors, tout d’abord : qu'est-ce que LLMs.txt exactement ?

Il s'agit d'un fichier standard proposé (généralement situé à la racine de votre site, par exemple : https://exemple.com/llms.txt) destiné à servir de « plan du site IA ».

En théorie, ce fichier peut :

  • Spécifiez quels robots d'exploration ou modèles d'IA peuvent accéder à votre site Web et quelles zones sont restreintes.
  • Répertoriez les pages, les ensembles de données ou les API approuvés pour une utilisation par l'IA.
  • Fournissez des métadonnées ou des conditions d'utilisation (par exemple, des informations de licence, des règles d'attribution ou des limites de débit) pour les modèles d'IA faisant référence à votre contenu.

En bref : il fournit aux robots d'exploration IA une feuille de route vers les informations les plus précieuses de votre site.

Le battage médiatique autour de LLMs.txt a décollé à la mi-2024 lorsque plusieurs développeurs de haut niveau, experts en référencement et chercheurs en IA ont commencé à en discuter comme un possible « chaînon manquant » entre les sites Web et les systèmes d’IA générative.

Parce qu'il s'appuie sur des normes Web familières telles que robots.txt et plan de site XML, beaucoup espéraient qu'il pourrait évoluer vers une nouvelle convention pour l'indexation et la citation de l'IA.

Cependant, pour l’instant, il n’existe aucune preuve claire que les principales plates-formes d’IA utilisent activement LLMs.txt dans leurs pipelines de données :

  • Google a déclaré que ses aperçus de l'IA et son mode AI continuent de s'appuyer sur référencement traditionnel signaux au lieu de LLMs.txt.
  • OpenAI recommande autorisant ses robots d'exploration Web, tels que OAI-SearchBot, dans le fichier robots.txt de votre site. Cependant, rien ne confirme que LLMs.txt affecte la façon dont ChatGPT classe ou cite le contenu.
  • Quelques journaux SEO montrer GPTBot récupère parfois les fichiers LLMs.txtmême si cela n'arrive pas souvent.

À ce stade, LLMs.txt n’est pas encore une norme établie ou largement adoptée au sein de l’industrie de l’IA. Mais les choses changent vite dans ce domaine, et ce qui est vrai aujourd’hui pourrait être dépassé dans quelques semaines seulement.

C'est pourquoi nous avons décidé de tester ce fichier nous-mêmes pour voir s'il fonctionne réellement.

Voici ce que révèlent nos résultats.

Combien de domaines utilisent le LLMs.txt ?

Commençons par examiner combien de sites Web l’utilisent réellement.

Hors du presque 300 000 domaines nous avons analysé, seulement 10,13% avait un fichier LLMs.txt en place. Cela veut dire presque 9 sites sur 10 ne l'ont pas encore adopté.

combien de sites Web ont un fichier LLMs.txtcombien de sites Web ont un fichier LLMs.txt

Cela fait de LLMs.txt une pratique de niche avec une adoption très limitée. En comparaison, des standards comme robots.txt ou sitemaps sont presque universels. LLMs.txt, quant à lui, est encore loin de ce niveau de reconnaissance.

En termes simples, il y a beaucoup de curiosité, mais très peu d'utilisation dans le monde réel jusqu'à présent.

Les domaines les plus performants utilisent-ils plus souvent LLMs.txt ?

Il peut sembler logique de supposer que les grands sites Web faisant autorité seraient les premiers à se lancer dans LLMs.txt. Après tout, les grands domaines disposent souvent des ressources et de la motivation nécessaires pour expérimenter tôt. Mais lorsque nous avons examiné les données, la tendance n’était pas celle à laquelle beaucoup s’attendaient.

l'impact de llms.txt sur le traficl'impact de llms.txt sur le trafic
  • Sites Web à faible trafic (0 à 100 visites) : 9,88 % d'adoption
  • Sites Web à trafic moyen (1 001 à 5 000 visites) : 10,54 % d'adoption
  • Sites Web à fort trafic (100 001+ visites) : 8,27 % d'adoption

Les pourcentages sont remarquablement proches. Les sites avec seulement quelques dizaines de visites par mois adoptent LLMs.txt à peu près au même rythme que ceux avec des milliers de visiteurs. Et étonnamment, les sites les plus grands et les plus établis sont en réalité un peu moins probable pour utiliser le fichier que ceux de niveau intermédiaire.

L'utilisation de LLMs.txt n'est pas concentrée parmi les leaders de l'industrie ou les « initiés ». Au lieu de cela, il est réparti presque uniformément sur le Web. En d’autres termes, LLMs.txt n’est pas encore une bonne pratique pour les domaines de premier plan ni un avantage secret utilisé par les plus performants. À l’heure actuelle, cela ressemble davantage à une expérience dispersée, avec des sites de petite et moyenne taille tout aussi susceptibles de l’essayer que les plus grands.

LLMs.txt est-il en corrélation avec la fréquence de citation de l'IA ?

Pour répondre à cette question, nous avons testé l'impact de la présence de LLMs.txt sur la fréquence à laquelle un domaine est cité par les LLM.

Pour cela, nous avons construit un modèle d'apprentissage automatique en utilisant XGBoostun algorithme qui trouve des modèles et fait des prédictions. Le modèle a examiné la fréquence à laquelle différents domaines sont cités, en tenant compte de plusieurs facteurs (notamment s'ils disposent d'un fichier LLMs.txt).

Étonnamment, lorsque nous avons supprimé le facteur LLMs.txt, les prédictions du modèle se sont réellement améliorées. Il est devenu plus précis et fiable sur les données de test. Cela signifie que la présence de LLMs.txt n'aidait pas le modèle à comprendre le comportement des citations. En fait, cela ajoutait du bruit ou confondait les informations.

Pour résumer, le fait d'avoir un fichier LLMs.txt ne rend pas un domaine plus susceptible d'être cité par les modèles d'IA. En fait, le modèle fonctionnait mieux sans cela. Ainsi, LLMs.txt ne semble pas avoir d'impact direct sur la fréquence de citation de l'IA. Du moins pas encore.

Devriez-vous implémenter LLMs.txt sur votre site ?

Cela dépend vraiment de ce que vous voulez réaliser.

Si vous êtes curieux de connaître les nouvelles normes du Web ou si vous appréciez l'ouverture dans la façon dont le contenu en ligne est utilisé, il y a peu d'inconvénients. Le fichier est petit, simple à créer et ne présente aucun risque technique.

Néanmoins, si vous espérez des avantages clairs et mesurables (comme davantage de citations IA et, par conséquent, du trafic), vous serez probablement déçu. Rien n'indique encore que les LLM s'appuient sur ce fichier d'une manière qui affecte les sites Web.

LLMs.txt ne changera pas grand-chose pour vous aujourd'hui. Mais l’inclure maintenant pourrait rendre votre site plus facile à utiliser si (ou quand) le format sera largement adopté par la suite.

Bref aperçu de la méthodologie

A tester si LLMs.txt a un impact sur la visibilité ou les citations de l'IAnous avons conçu une analyse structurée en plusieurs étapes. L'objectif était d'évaluer les taux d'adoption, les corrélations de trafic et l'impact mesurable sur la fréquence de citation du LLM.

Pour cela, nous avons analysé 300 000 domainescapturant :

  • Présence ou absence d'un fichier LLMs.txt
  • Niveaux de trafic (faible, moyen, élevé)
  • Fréquence de citation dans les résultats du modèle d'IA

Notre objectif était citations au niveau du domaine (à quelle fréquence chaque site est apparu comme source parmi les réponses LLM échantillonnées).

Nous avons combiné des méthodes statistiques traditionnelles avec des modèles d'apprentissage automatique pour évaluer à la fois la corrélation et la valeur prédictive :

  • Corrélation de Spearman
  • Régression XGBoost
  • Analyse SHAP

Clause de non-responsabilité: Les résultats que nous partageons reflètent l'importance relative des facteurs au sein du modèle spécifique et de l'ensemble de données testés. Étant donné que ces facteurs interagissent les uns avec les autres, les résultats peuvent changer si certains sont ajoutés ou supprimés. En tant que tels, ces résultats doivent être considérés comme dépendants du contexte.

Conclusion

Notre analyse de 300 000 domaines montre que LLMs.txt n'a pas d'impact sur la façon dont les systèmes d'IA voient ou citent votre contenu aujourd'hui. ​​Même ainsi, l'ajout du fichier constitue un moyen simple de se préparer à la prochaine vague d'indexation par l'IA. Aujourd'hui, c'est facultatif ; demain, cela pourrait être indispensable.

What do you think?

0 points
Upvote Downvote

Written by manuboss

Examen de l'outil d'optimisation de contenu MarketMuse (2025)

Comment vérifier votre profil d'entreprise Google en 2025