La façon dont les moteurs de recherche indexent les sites n’a pas beaucoup changé au cours des trois dernières décennies.
S’il est important que les administrateurs Web mettent constamment à jour leurs processus conformément aux meilleures pratiques s’ils souhaitent maintenir une indexation rapide et complète, la technologie sous-jacente des moteurs de recherche est restée en grande partie la même à un niveau fondamental.
Mais cela est peut-être sur le point de changer.
IndexNow, un protocole qui permet une communication directe avec les moteurs de recherche, a le potentiel de modifier radicalement le paysage de la recherche.
Avoir le contrôle de votre site Web est stimulant, et mieux comprendre comment votre contenu est indexé conduira à une visibilité plus large et plus rapide dans les moteurs de recherche.
Cet article explique certains des derniers développements en matière d’indexation et comment favoriser une plus grande autonomie sur l’exploration de contenu est une victoire nette pour les référenceurs, les webmasters, les moteurs de recherche et, finalement, les utilisateurs. Nous décrirons également les meilleures pratiques d’indexation actuelles.
Quel rôle IndexNow jouera-t-il dans l’avenir de la recherche ?
IndexNow est un sujet brûlant dans l’espace SEO. Si vous ne l’avez pas déjà rencontré, il s’agit essentiellement d’un service de notification que les administrateurs Web utilisent pour alerter les moteurs de recherche lorsqu’ils publient du contenu sur leurs sites (ou suppriment un ancien contenu).
Parce que la technologie a le potentiel d’économiser des quantités importantes de ressources pour les moteurs de recherche (en réduisant le besoin d’exploration « exploratoire » continue), de nombreux experts en référencement considèrent qu’il est extrêmement probable qu’elle sera universellement adoptée.
Il présente également une proposition intéressante pour les référenceurs, car il leur permet d’informer instantanément les moteurs de recherche des modifications apportées à leurs sites. Cela peut parfois prendre des semaines ou des mois pour que de nouvelles pages soient découvertes avec le crawling traditionnel.
Microsoft et Yandex ouvrent la voie lorsqu’il s’agit de donner aux webmasters le contrôle sur comment et quand leurs sites sont explorés. IndexNow comptabilise 7% des nouveaux sites indexés dans Bing. Seznam.cz a également adopté IndexNow au début de 2022. Plus de 16 millions de sites Web utilisent le protocole, et il est proposé via les principaux plugins WordPress comme Yoast. Cloudflare et Duda l’ont également intégré à leurs services.
Cependant, IndexNow ne deviendra probablement pertinent de manière significative que si Google choisit de le prendre en charge. Google a confirmé qu’il est actuellement en phase expérimentale. Jusque-là, ce ne sera pas le genre de technologie de déplacement de terre qu’il pourrait être. À notre avis, du moins.
Comment utiliser IndexNow
Il n’y a aucun inconvénient à utiliser IndexNow sur votre site. C’est particulièrement le cas si vous gérez un site plus petit et que l’indexation est un processus lent. De grandes marques comme LinkedIn et eBay exploitent et bénéficient déjà du protocole.
Suivez les étapes ci-dessous pour commencer à utiliser IndexNow :
- Créez et hébergez une clé API : Vous devez générer une clé API pour vérifier la propriété de votre site et de toutes les URL soumises. Vous pouvez utiliser L’outil de génération d’API de Bing pour faire ça. Vous devez ensuite héberger un fichier .txt encodé dans le répertoire racine de votre site Web contenant la clé.
- Soumettre les URL : Une fois que vous avez configuré la vérification pour votre site, vous pouvez envoyer une requête HTTP à l’URL suivante : https://
/indexmaintenant ?URL=url-changé&clé=votre-clé - Vérifier le succès de la soumission : Vérifiez le succès des URL soumises à l’aide de Bing Webmaster Tools ou de votre logiciel de suivi.
IndexNow a publié documentation complète. Vous pouvez également utiliser un plugin WordPress ou un réseau de diffusion de contenu (CDN) prenant en charge IndexNow.
Autres tendances clés en matière d’indexation
La présence croissante d’IndexNow n’est pas la seule tendance d’indexation qui mérite d’être évoquée. En voici trois autres dont les référenceurs devraient tenir compte :
- SEO programmatique et contenu généré par l’IA : L’essor du contenu généré par l’IA et du référencement programmatique (la création automatique d’énormes quantités de pages ciblant des mots-clés individuels ou de petits ensembles de mots-clés) présente un problème pour les moteurs de recherche en termes d’exploration. S’il y a des millions de pages générées automatiquement, elles ne pourront pas explorer le Web efficacement. Cela explique peut-être pourquoi Google a pénalisé le contenu généré par l’IA avec sa dernière mise à jour en attribuant le contenu écrit pour les humains.
- La présence continue des crawl bots : Les crawl bots ne vont nulle part. Ils resteront toujours la clé de la façon dont les moteurs de recherche indexent les sites Web. Google utilise actuellement HTTP/2, qui est un protocole de transfert à faible ressource. Il est essentiel de comprendre comment les robots parcourent votre site Web pour collecter des données. Avec cette compréhension, vous pouvez structurer votre site en conséquence pour rationaliser l’indexation.
- Plus grande disponibilité d’outils pour vérifier l’état de l’indexation : Il est de plus en plus facile pour les référenceurs de vérifier l’état d’indexation de leurs pages Web et de leurs actifs numériques. Un exemple clé est le rapport d’indexation vidéo récemment lancé dans Google Search Console. Cette tendance se poursuivra probablement à mesure que les logiciels de référencement deviendront plus granulaires et avancés.
Liste de contrôle des meilleures pratiques d’indexation
Le processus que les moteurs de recherche utilisent généralement pour indexer le contenu est relativement simple. Après la publication d’une page Web, les moteurs de recherche parcourent les pages Web et, en supposant qu’aucune politique n’est enfreinte, les indexent dans leur base de données.
Voici une liste de contrôle rapide et complète des meilleures pratiques d’indexation :
- Configurez les pings IndexNow : Il existe différentes manières d’alerter les moteurs de recherche sur le contenu nouveau et mis à jour via IndexNow. Consultez la documentation publiée pour un aperçu de ceux-ci.
- Assurez-vous que votre site est adapté aux mobiles : Google exploite un système d’indexation axé sur les mobiles, ce qui signifie qu’il donne la priorité aux sites mobiles lors de l’exploration.
- Pages appropriées sans index : Si vous avez des pages que vous ne souhaitez pas voir apparaître dans les résultats de recherche, utilisez la balise « noindex ». Vous êtes moins susceptible de rencontrer des erreurs dans les rapports d’indexation (tels que ceux de la Search Console) si vous n’indexez pas correctement les pages.
- Supprimez les balises noindex mal placées : Vous devez effectuer des vérifications régulières pour identifier les pages sur lesquelles les balises noindex ont été mal placées.
- Surveillez l’état de l’index de vos pages avec la Search Console : Vérifiez que vos pages sont indexées dans Google avec la Search Console. Google fournit probablement l’essentiel de votre trafic.
- Soumettez des sitemaps aux principaux moteurs de recherche à l’aide des outils applicables aux webmasters : Créez et soumettez des sitemaps aux moteurs de recherche, surtout si vous avez un grand site.
- Créez une architecture de liens internes robuste : Lien interne pour permettre une exploration efficace. L’utilisation d’une structure d’URL logique, basée sur des catégories et intelligible par l’homme est également une bonne pratique.
- Éliminer le contenu dupliqué : Le contenu dupliqué ralentit l’exploration. Si nécessaire, utilisez un logiciel pour effectuer des vérifications et supprimer le contenu inutile. Utilisez les étiquettes rel=canonical si vous avez besoin de publier du contenu en double.
- Compte pour les pages Web autonomes : Il est important de créer des liens vers des pages Web autonomes, en particulier des pages de destination, qui ne sont pas accessibles à partir d’autres zones de votre site.
- Optimisez la vitesse et la taille de la page : En vous assurant de suivre les meilleures pratiques en matière de minification et de JavaScript, vous ne dépasserez pas par inadvertance les limites d’exploration des moteurs de recherche.
- Ajoutez un fichier robot.txt si nécessaire : Un fichier robot.txt indique aux moteurs de recherche quelles pages doivent être explorées. Il est utilisé lorsque vous souhaitez que les pages restent indexées tout en limitant l’activité du robot qui pourrait surcharger vos serveurs.
- Assurez-vous que les métadonnées sont correctes : L’ajout de métadonnées précises aux pages Web rend l’exploration plus efficace. Cela inclut les méta-titres et les descriptions, les robots, googlebot, SafeSearch et les attributs rel.
- Optimisez les sites multilingues : Utilisez des URL basées sur l’emplacement ou des balises hreflang pour spécifier les pages qui s’appliquent à différents emplacements.
- Utilisez les paramètres de vitesse d’exploration de Google (si nécessaire) : Ce ne sera pas un problème pour la grande majorité des administrateurs Web, mais Google offre des administrateurs Web un certain degré de contrôle sur la façon dont il explore leurs sites Web. Des limites d’exploration d’urgence peuvent être définies dans certaines circonstances.
Utilisation de BrightEdge pour une meilleure indexation
L’indexation peut être un réel problème si vous avez de grandes quantités d’erreurs sur votre site, car elle empêche la recherche d’explorer, ce qui limite vos performances organiques. BrightEdge ContentIQ fait passer l’identification des erreurs techniques au niveau supérieur et a le pouvoir de prendre en charge les explorations de sites pour des millions de pages. Il permet aux spécialistes du marketing d’identifier, de hiérarchiser et de corriger les erreurs et les problèmes du site Web à grande échelle avant qu’ils n’affectent les performances organiques. Le moteur de recommandations de la plate-forme permet d’être facilement alerté sur ces problèmes prioritaires et d’indiquer clairement les étapes à suivre pour les résoudre.
Conclusion
L’indexation efficace des sites est un élément essentiel de l’optimisation des moteurs de recherche, en particulier pour les grandes organisations pour lesquelles des problèmes sont plus susceptibles de survenir.
Rester au courant des modifications et mettre à jour régulièrement votre processus conformément aux meilleures pratiques vous aide à vous assurer que toutes les pages de votre site sont indexées et que vous pouvez résoudre efficacement les problèmes.
Les référenceurs doivent également se tenir au courant de l’évolution et de la croissance d’IndexNow. Il est probable que Google adoptera IndexNow ou développera sa propre technologie, auquel cas il vous sera avantageux d’adopter de nouveaux protocoles le plus tôt possible.