- Il y a 10 ans, quand on lançait un nouveau blog WordPress, Google indexait le contenu en quelques heures, parfois en quelques minutes
- La mission de Google était de « ranger les informations à l’échelle mondiale et les rendre universellement accessibles et utiles »
- Pour les utilisateurs, cela signifiait que si une information existait quelque part sur le web, on pouvait la trouver via la recherche Google
- Pour les créateurs de contenu, c’était une opportunité en or : produire du contenu signifiait que Google aiderait les gens à le trouver
La course aux armements du SEO et la réponse de Google
- Là où il y a une opportunité, il y a aussi des abus
- Le web a été inondé de contenus de faible qualité
- Achat et vente de liens
- Nombreuses tactiques SEO grises et black hat
- Google a déployé une série de mises à jour d’algorithmes, comme Panda et Penguin, pour assainir les pratiques SEO manipulatrices
- Cela a ressemblé à un bras de fer de 20 ans entre les experts SEO et Google
L’essor et le déclin de « content is king »
- Un nouveau dogme a émergé dans l’industrie : « content is king »
- Un bon contenu peut naturellement attirer des liens et générer des signaux positifs d’interaction utilisateur, ce qui améliore le classement
- L’algorithme de Google est censé valoriser intrinsèquement les contenus de haute qualité et leur attribuer un bon classement
- Beaucoup de créateurs produisant un contenu réellement de qualité n’ont pourtant jamais atteint le classement qu’ils estimaient mériter, ce qui montre que la qualité seule ne suffit pas
- L’un des problèmes fondamentaux était que ni Google ni personne d’autre ne sait déterminer algorithmiquement ce qu’est un « bon » contenu
La révolution du contenu généré par l’IA
- En 2018, lorsque OpenAI a dévoilé GPT-1, l’avenir de la création de contenu est devenu évident
- Des contenus générés par l’IA, indiscernables de textes écrits par des humains, sont apparus
- L’ère du « content is king » touche à sa fin
La crise existentielle de Google
- Du point de vue de Google, l’entreprise fait face à un futur où l’IA peut générer des quantités illimitées de contenus ressemblant à ceux d’humains
- La réponse de Google a été double
- Promouvoir de manière vague le concept d’expertise, d’autorité et de fiabilité (Expertise, Authoritativeness, Trustworthiness), souvent interprété en pratique comme une préférence pour les marques connues et les sites déjà établis
- Abandonner la mission qui consistait à tout indexer pour devenir sélectif. Très sélectif.
La nouvelle réalité : l’indexation sélective
- Google ne cherche plus à indexer l’ensemble du web
- En pratique, il est devenu très sélectif et refuse d’indexer la majorité des contenus
- Ce n’est pas parce que les créateurs de contenu n’atteignent pas un certain seuil de qualité arbitraire, mais parce que Google a fondamentalement changé son approche de son rôle de moteur de recherche
- D’après mon expérience, Google semble désormais fonctionner selon le principe « ne pas indexer par défaut »
- Le contenu n’est inclus dans l’index que si Google estime, à travers divers facteurs, qu’il est réellement nécessaire
- Originalité extrême du contenu : écrire sur un sujet peu couvert ne suffit pas. Google semble exiger que le contenu soit véritablement inédit ou qu’il comble un manque important dans son index
- Autorité perçue : les sites que Google considère comme très autoritaires dans une niche peuvent voir davantage de contenus indexés, sans que cela soit garanti pour autant
- Notoriété de marque : les marques bien connues voient souvent la majorité de leurs contenus indexés, tandis que les blogueurs plus petits ou moins connus sont filtrés bien plus sévèrement
- Indexation temporaire puis désindexation : en pratique, Google indexe souvent les nouveaux contenus très rapidement pour ne pas rater une actualité de dernière minute ou une mise à jour importante. Peu après, Google peut retirer ce contenu de son index, et il peut ensuite rester désindexé. Ainsi, le fait d’être indexé au départ ne signifie pas nécessairement que Google considère votre contenu comme précieux
- J’observe ce changement directement
- Par le passé, lorsqu’on configurait un nouveau domaine, il était indexé en moins d’une heure, parfois en quelques secondes
- C’était vrai même pour un nouveau domaine sans aucune mention ni backlink
- Si l’on recherchait le titre d’un nouveau billet de blog ou une phrase unique de l’article, il apparaissait immédiatement sur la première page de Google
- Désormais, pour chaque contenu, Google décide s’il mérite ou non d’être indexé, et dans la plupart des cas la réponse est « non »
- Même un contenu jugé vraiment original, ou portant sur un sujet pratiquement jamais traité, peut ne pas être indexé
- Mais si l’on écrit sur un sujet que Google estime déjà couvert ailleurs, il y a de fortes chances qu’il ne soit pas indexé
- Cela peut arriver même à des auteurs respectés disposant d’un lectorat conséquent
- Il est aussi intéressant de constater que lorsqu’un contenu parvient à être indexé, il se classe souvent étonnamment bien
- Comme si la barrière à l’indexation était devenue si haute qu’une fois franchie, la voie vers un bon classement était presque déjà dégagée
- Mais atteindre ce point est devenu exponentiellement plus difficile
- L’important est que cette sélection extrême n’est pas appliquée de manière égale
- Les marques célèbres voient la plupart de leurs contenus indexés rapidement, tandis que les petits blogueurs ou les sites de niche sont souvent évalués selon des critères bien plus stricts pour entrer dans l’index
- Pour ces petits acteurs, il ne suffit plus de produire un bon contenu : il faut convaincre que ce contenu est indispensable à l’index de Google
Conséquences
- Google s’est transformé, passant d’un moteur de recherche généraliste à quelque chose qui ressemble davantage à un catalogue exclusif
- Pour les utilisateurs, cela signifie que l’information qu’ils cherchent peut exister sans être découvrable via Google
- Je suis convaincu qu’une immense quantité de contenus de valeur passe inaperçue
- Des informations que les utilisateurs pourraient rechercher peuvent ne pas apparaître dans les résultats Google
- Non pas parce qu’elles n’existent pas, mais parce que Google a choisi de ne pas les inclure
- Pour les créateurs de contenu, si Google refuse d’indexer la majorité des contenus, obtenir de la visibilité devient un défi crucial
10 commentaires
Il semble que l’affirmation de l’auteur, selon laquelle Google choisit de manière sélective ce qu’il affiche dans les résultats de recherche, soit exacte.
Même si Google Search Console indique que la page a été explorée, elle n’apparaît pas dans les résultats de recherche.
Dans le cas de mon blog, certains articles sont indexables et d'autres non.
Il semble que, du moins selon Google, lorsqu'un contenu est jugé redondant par rapport à d'autres documents, ou considéré comme moins original ou moins utile qu'eux, il ne soit pas inclus dans l'index.
On a l’impression qu’on entre dans une époque où il faut aussi se démarquer de l’IA sur le plan du contenu et rivaliser sur ce terrain. Même si le texte original ne reflète qu’un avis personnel, il est tout à fait plausible de prévoir qu’une telle grande tendance se dessine.
Comme sur les commentaires de Hacker News, cela dépendra probablement de la nature et de l’ampleur du contenu, et les preuves sont limitées, mais personnellement, cela me paraît assez plausible.
Au premier trimestre de cette année, nous avons mené dans l’entreprise un travail global d’amélioration du SEO et nous le surveillons depuis.
Nous avons soumis environ 100 000 nouvelles URL et les avons suivies pendant environ cinq mois, mais ces nouvelles URL ne passent pas à l’étape suivante, restant sur « découverte » ou « crawlée » sans rapport d’erreur particulier ; récemment, même des URL déjà indexées ont disparu par dizaines de milliers.
Une nouvelle politique anti-spam a été annoncée en mars, et il y a bien des problèmes de Web Vitals, mais cela ne suffisait pas à l’expliquer, donc je me posais la question ; cette thèse me semble crédible.
L’auteur se présente comme un expert SEO et un développeur freelance, mais est-ce qu’il essaie simplement de faire du marketing de la peur ?
90 % des experts SEO sont des escrocs.
Ça tourne en rond, Yahoo~ ?
Google n’indexe plus votre contenu par défaut
...
Comme il s’agit d’une affirmation personnelle de l’auteur, il y a beaucoup de débats à ce sujet dans les commentaires de Hacker News.
En pratique, ceux qui pensent que c’est vrai et ceux qui pensent que ce n’est pas le cas se disputent.
Personnellement, dans la situation actuelle, je me dis que du point de vue de Google, il est sans doute plus logique de faire une indexation sélective puis de désindexer ensuite. Il y a vraiment trop de sites spam aujourd’hui.
Heureusement, tous les sites que j’exploite sont bien indexés ^^;
> Par le passé, lorsqu’on configurait un nouveau domaine, il était indexé en moins d’une heure, parfois en quelques secondes.
J’ai aussi un domaine que j’ai acheté au début de cette année, qui a encore peu de contenu et, là aussi, aucun lien, mais il est tout de même bien indexé. (Je n’ai pas mesuré le temps que cela a pris, cela dit...)
C’est peut-être devenu un peu plus défensif, mais cela ne semble pas être problématique au point que cela pose un vrai souci.