1 points par GN⁺ 5 시간 전 | 1 commentaires | Partager sur WhatsApp
  • La baisse de qualité des moteurs de recherche est l’occasion de réutiliser les hyperliens et les pages de liens personnelles, une ancienne façon d’explorer le web
  • Google est inutilisable depuis des années, DuckDuckGo/Bing se dégradent régulièrement, et Yandex est relativement impressionnant mais reste loin de l’état de l’art
  • YouTube est de loin le pire : les mêmes visages et arrière-plans de titres peaufinés s’y répètent, au point d’éviter la recherche elle-même
  • Kagi semble dépendre des moteurs ci-dessus, et les résumés de recherche par LLM ont la limite d’être des résumés non déterministes construits sur des résultats de recherche de faible qualité
  • Quand des sites personnels créent directement des liens vers les sites qu’ils aiment, cela devient une manière de reconquérir le World Wide Web hyperlien par hyperlien face au web centralisé

Problématique centrale

  • Le point de départ est l’idée qu’il devient difficile de nier la dégradation des performances des moteurs de recherche
  • Google est inutilisable depuis des années, DuckDuckGo/Bing se dégradent régulièrement, et Yandex est plus impressionnant en comparaison, mais reste à plusieurs pas de l’état de l’art d’autrefois
  • La recherche YouTube est devenue quelque chose qu’on évite instinctivement à cause des vidéos qui répètent les mêmes visages et cartes de titre au format similaire
  • Kagi est souvent recommandé, mais semble s’appuyer sur les trois fournisseurs mentionnés plus haut
  • Les LLM peuvent chercher à votre place, mais lorsque les résultats de recherche eux-mêmes sont de mauvaise qualité, les résumés non déterministes construits par-dessus ne résolvent pas le problème

Réponse proposée

  • La solution consiste à penser en dehors de la barre de recherche, et la réponse, ce sont les hyperliens
  • Aux débuts du web, on découvrait souvent d’autres sites intéressants en cliquant sur la classique page “links” des sites sympas
  • Ces liens étaient parfois sans rapport ou morts, mais ils menaient parfois exactement à ce qu’il fallait, vers des sites dont on se souvenait longtemps
  • Au lieu de se lamenter sur le web centralisé, les propriétaires de sites peuvent créer directement des liens vers les sites qu’ils aiment
  • Ma nouvelle page de liens n’est ni un “web ring” ni un suivi réciproque, c’est simplement une liste de choses que j’aime
  • Je n’attends pas que les sites liés renvoient un lien, et même si quelqu’un me lie, il ne faut pas s’attendre à un lien en retour
  • Si chacun met des liens là où il le souhaite et crée sa propre page de liens, cela devient une manière de reconquérir le World Wide Web, hyperlien par hyperlien

1 commentaires

 
GN⁺ 5 시간 전
Avis sur Lobste.rs
  • Malheureusement, j’ai constaté que Google met en réalité d’assez bons liens dans le panneau d’aperçu IA, et que ces liens sont souvent meilleurs que les premiers résultats de recherche habituels. Par exemple, en cherchant « what is a linked list », le premier élément tout en haut du panneau latéral de la zone IA était un fil Reddit, suivi de l’article Wikipedia correspondant. Personnellement, je pense que Wikipedia devrait être en première position, mais bon. En revanche, le premier résultat de recherche classique était un article de GeeksForGeeks. Ce n’est pas pour dénigrer GeeksForGeeks, mais c’est un type de contenu très fortement optimisé pour le référencement, alors qu’il existe de meilleurs contenus sur le Web qui sont malgré tout moins bien classés. Dans ce cas, Wikipedia arrivait en deuxième position. Même si les LLM choisissaient mieux les liens, je ne pense pas que ce soit vraiment le cas ; il est plus probable qu’il s’agisse d’un résultat soigneusement conçu, et c’est un exemple typique d’enshittification. Ils cachent de bons liens là-dedans, et si on clique dessus, du point de vue des métriques on devient un heureux consommateur de bric-à-brac. C’est parce qu’ils savent déjà que les vrais résultats de recherche sont lamentables.

    • Tu dis « ce n’est pas pour dénigrer GeeksForGeeks », mais ce site mérite largement d’être critiqué. Il est bon en référencement, mais il contient rarement l’information qu’on cherche vraiment, et c’était déjà du contenu « slop » avant même que ce mot ne se répande. C’est d’ailleurs l’un des sites que j’ai bloqués dans mes résultats de recherche.
    • Une vraie révélation pour moi a été d’utiliser, au lieu d’un moteur de recherche généraliste, une recherche spécialisée quand il y en a manifestement une plus adaptée. Si je cherche quelque chose sur les listes chaînées, il y a de fortes chances que ce que je veux se trouve sur Wikipedia, donc aucune raison d’utiliser Google. J’ai ajouté des raccourcis dans Firefox pour pouvoir taper @w linked list et aller directement sur Wikipedia. On peut faire pareil avec plein d’autres recherches plus étroites et spécialisées, comme Arch Wiki, MDN, Stack Overflow ou IMDB. L’idée même qu’une seule entreprise puisse gérer un service censé retrouver n’importe quelle information dans le monde entier me paraît de plus en plus douteuse. J’ai écrit là-dessus l’an dernier. Il est tentant d’être nostalgique de l’époque où « il suffisait de mettre quelques mots-clés dans Google pour trouver n’importe quoi qui existait », mais en réalité cela n’a jamais été vrai. En échange du fait de nous éviter d’errer dans un Web chaotique, nous avons laissé Google redéfinir ce qu’est le Web lui-même. On disait « si ce n’est pas dans Google, ça n’existe pas », mais c’était faux, et on commence seulement maintenant à voir à quel point. Il est fondamentalement impossible d’avoir une vue objective, à la manière d’un dieu, de l’ensemble du Web. Pour indexer quelque chose d’aussi vaste que le Web tout en empêchant les abus, il faut prendre des milliers de décisions, grandes et petites. À chaque recherche — et même à chaque abstraction — on accepte une simplification du réel. La carte n’est pas le territoire, et l’index n’est pas le Web. https://search.technomancy.us/why
    • Il existe aussi &udm=14, qui se présente comme un « code Konami de désenshittification ». Il redirige toujours vers l’onglet de recherche Web, normalement caché sous « More ». Je l’ai activé sur plusieurs appareils depuis quelque temps et je suis très content d’avoir retrouvé une recherche « stupide ». Il reste encore les défauts du référencement et de la manipulation du classement, mais cela rend un peu du contrôle que les aperçus IA ont confisqué.
    • Ce phénomène dure depuis un moment, et j’en avais déjà donné un exemple sur mon blog l’an dernier. C’est extrêmement agaçant, et cela ne peut qu’avoir été conçu délibérément pour pousser les gens à rester plus longtemps sur le site de Google. À mes yeux, le marché entre Google et les sites Web est quasiment nul et non avenu. S’ils ne sont pas prêts à afficher un lien vers mon site, pourquoi devrais-je autoriser leurs bots à l’explorer ?
  • Comme cela a aussi été mentionné sur le blog, si vous ne l’avez pas encore essayé, ça vaut le coup de tester Kagi. Il est bien connu que Kagi utilise les données de crawl ou les index de recherche d’autres grands moteurs, mais il ne reprend que les données et classe lui-même les résultats de recherche Je l’utilise depuis plus de deux ans et j’en suis satisfait ; il m’est déjà arrivé d’y trouver des choses que je ne trouvais pas avec DuckDuckGo. On peut faire monter, descendre ou bloquer des sites dans les résultats, et il y a aussi beaucoup de fonctionnalités comme Redirects (URL Rewrites) J’aime aussi leur façon de communiquer publiquement. Le Changelog contient des liens vers chaque ticket de Kagi Feedback, qui sert aussi de suivi d’incidents. Il y a également une page Status. Concernant l’idée de créer une page de liens sur son propre site, Kagi Small Web est assez proche, et on peut visiter des sites au hasard sur le site Kagi Small Web John Gruber (Daring Fireball) et Cory Doctorow (Pluralistic) l’utilisent aussi. Voir par exemple Seriously, Give Kagi a Try, Another Periodic Suggestion to Try, Just Try, Switching to Kagi for Search, Tim Bray: ‘Mourning Google’, The Talk Show: ‘A Professional Internet User’, With Kagi Founder and CEO Vlad Prelovac, Tag: kagi comme références Il existe une version d’essai de 100 recherches, et selon votre volume de recherche, le forfait Starter à 54 $ par an peut suffire. Si vous avez besoin de plus, vous pouvez vérifier sur Individual Pricing. Il existe aussi Duo and Family, ce qui peut faire baisser le coût par personne, mais seulement à partir de Professional. On peut faire un upgrade ou un downgrade à tout moment, et le solde restant est proratisé puis appliqué au nouveau forfait

    • Mais Kagi utilise Yandex, donc payer revient indirectement à soutenir le régime de Poutine. Je n’ai pas envie de soutenir en connaissance de cause quelque chose qui contribue à tuer des Ukrainiens
    • En réalité, ils agrègent plusieurs sources. Cela dit, je suis d’accord sur le fait que c’est excellent, et je viens justement de renouveler mon abonnement
    • De ce que je sais, DuckDuckGo permet aussi de bloquer des sites dans les résultats. Je ne crois pas qu’il permette de les faire monter ou descendre, ou en tout cas je n’ai jamais essayé Il faut aussi savoir que Kagi a commencé comme entreprise d’IA avant de se tourner vers la recherche [https://help.kagi.com/kagi/ai/kagi-ai.html]. Je ne cherche pas à suggérer quoi que ce soit par ce simple fait, mais beaucoup de gens ne le savent peut-être pas, donc je le partage Plus directement, l’ensemble du billet est rédigé comme une publicité, donc il vaut mieux prendre le conseil avec prudence
    • J’ai entendu beaucoup de bien de Kagi, mais dans mon cas je n’ai pas eu la même chance. Je n’essaie pas de nier cette expérience, et je pense qu’il est possible que je l’utilise mal. Du coup, je suis curieux de savoir quel type de recherches vous faites sur Kagi Ma requête de référence était "sesans spin echo length formula". Sur DuckDuckGo, le premier lien est la page SESANS Wiki, qui ne contient pas la formule que je cherche, et le deuxième lien est un article qui contient cette formule. Sur Google, le premier lien est un document de conférence qui contient beaucoup de bases mathématiques sur le SESANS, mais pas la formule voulue ; là aussi, c’est le deuxième lien, un article, qui donne la formule. Il explique aussi mieux les constantes que le deuxième lien de DDG Sur Kagi, je n’ai trouvé la relation cherchée qu’au sixième lien. Selon mes critères, Kagi est donc moins bon, mais il est possible que mon critère soit mauvais. Je me demande pour quels types de recherches Kagi fonctionne le mieux
    • J’aimais bien Kagi, mais j’ai arrêté de l’utiliser quand j’ai appris qu’ils envoyaient de l’argent à la Russie Récemment, j’ai commencé à utiliser Uruky et ça me plaît assez. Ce n’est pas parfait, mais c’est meilleur que le Google actuel. En revanche, je n’ai pas creusé en détail l’origine des données ; je me suis juste assuré que ce n’était pas Yandex, donc si quelqu’un en sait plus, ça m’intéresse
  • En 2024, Google et Reddit ont signé un accord de 60 millions de dollars pour utiliser le contenu de Reddit dans l’entraînement de l’IA de Google. Du coup, la recherche Google actuelle ressemble de plus en plus à une recherche avec le préfixe site:Reddit Les anciens bons sites web sont relégués derrière des résultats de faible qualité et sans rapport

  • En ce moment, je me demande si la solution ne serait pas des annuaires curatorés par des humains, comme les premiers sites Yahoo, auxquels on ajouterait un moyen de rechercher ces sites. Marginalia semble s’en rapprocher dans une certaine mesure, mais je n’y vois pas vraiment de répertoire

    • J’ai eu exactement la même pensée. En pratique, l’auteur a essentiellement réinventé le répertoire web et, malgré les problèmes de passage à l’échelle, on dirait qu’on recommence à en avoir besoin
    • Oui, c’est exactement ça. J’aimerais vraiment que quelqu’un en crée un
  • Je ne sais pas si l’affirmation selon laquelle « Kagi semble dépendre des trois fournisseurs mentionnés plus haut » est vraie, mais au fond ce n’est littéralement pas très important. Kagi Search est vraiment excellent et je continuerais probablement à payer même si le prix doublait. Je fais en moyenne 1 432 recherches par mois, donc pour moi ça vaut largement le coût

    • Je suis curieux de savoir quelle différence vous avez constatée en faisant tourner Kagi et d’autres moteurs côte à côte. Vous avez des requêtes d’exemple ?
  • On dit que « la dégradation des moteurs de recherche est désormais difficile à nier », mais est-ce que je suis le seul à ne pas le ressentir ? Je cherche toujours ce dont j’ai besoin et je le trouve

  • J’envisage de mettre en cache presque tout en continu et de l’indexer pour la recherche en texte intégral, parce que certains contenus semblent disparaître du Web ou devenir pratiquement introuvables. Des projets similaires avaient déjà été partagés ici auparavant. L’idée de base consiste à utiliser SQLite et FTS5 pour tout. C’est un domaine qu’il faut approfondir.

    • J’ai créé mon moteur de recherche hyperpersonnalisé avec SQLite FTS5. Je n’indexe pas encore l’historique du navigateur, seulement les favoris et toutes les URL que j’ai publiées sur mes comptes de réseaux sociaux. Mais j’envisage clairement aussi d’indexer l’historique du navigateur. https://search.technomancy.us Ce serait bien que d’autres fassent aussi des essais.
  • Je l’ai vu mentionné dans deux commentaires, mais ça vaut la peine de laisser les liens ici. Marginalia Search est excellent. https://marginalia-search.com/ https://about.marginalia-search.com/

  • J’ai déjà écrit une réponse à quelqu’un d’autre dans ce fil, mais comme cela semble lié au billet de blog, je le poste aussi en commentaire principal. Si cela paraît trop autopromotionnel ou déplacé, vous pouvez le supprimer. En bref, pour résumer mon sentiment, j’ai passé un moment à faire une sorte de deuil en pensant avoir perdu le Web que je connaissais en grandissant. Mais une grande partie de cela existe encore quelque part, je ne le savais simplement pas. Le Web moderne n’est évidemment pas le même, et une bonne part de ce dont j’ai fait le « deuil » relevait de la nostalgie ou de l’âge que j’avais à l’époque, mais le Web reste immense et rempli de choses intéressantes, utiles et amusantes. C’est juste devenu vraiment difficile à trouver, et ce, même avant que les outils d’IA ne commencent à dévorer les moteurs de recherche. J’ai beaucoup réfléchi à l’expérience qui me manquait, et pour plusieurs raisons je suis arrivé à la même conclusion que l’auteur du blog. Il faut que des liens vers de bonnes choses soient partagés par de vraies personnes, et il faut cultiver une manière de surfer sur le Web plus lente et plus intentionnelle. C’est dans cet esprit que j’ai créé un outil pour construire des annuaires Web collaboratifs : https://linklists.net C’est encore très petit et assez brut par endroits. Comme c’est autant un outil qu’un projet artistique, j’en ai très peu fait la promotion et je l’ai surtout diffusé un peu parmi les gens du Web indé. Il tourne en alpha depuis quelques mois, et je vois déjà des aspects qu’il faudra revoir en profondeur, mais si quelqu’un est curieux et veut l’essayer, cela peut valoir le coup d’y jeter un œil.