4 points par GN⁺ 2026-01-11 | 1 commentaires | Partager sur WhatsApp
  • Projet web utilisant Claude Code pour explorer automatiquement les relations entre thèmes dans 100 livres
  • Analyse les concepts de chaque livre et les visualise sous forme de plus de 40 connexions thématiques (trails), comme « Useful Lies », « Invisible Crack » et « Name Game »
  • Chaque trail relie de manière transversale des concepts issus de domaines variés comme la psychologie, la technologie, les organisations, la créativité et la pensée systémique
  • L’utilisateur peut cliquer sur chaque trail pour explorer les livres associés et les concepts clés correspondants (ex. : Self-deception, Innovation, Tacit knowledge)
  • Propose une nouvelle manière de lire et de faire de la recherche, où l’IA explore de façon structurelle les relations entre les connaissances

Vue d’ensemble du projet

  • Trails est un système qui utilise Claude Code pour analyser le contenu de plusieurs livres et en dégager automatiquement des thèmes communs ou des connexions conceptuelles
  • Le résultat visualise les liens thématiques entre les livres sous la forme de « trails »
    • Chaque trail relie les idées de plusieurs livres autour d’un concept donné

Exemples de trails principaux

  • Useful Lies : traite du comportement humain qui utilise l’auto-illusion comme stratégie
    • Concepts associés : Self-deception, Evolutionary psychology, Blue lies
  • Invisible Crack : phénomène où de minuscules défauts s’accumulent jusqu’à provoquer un échec catastrophique
    • Concepts associés : Brittle fracture, Metal fatigue, Gradual change
  • Ideas Mate : une propriété intellectuelle peu contraignante accélère l’innovation grâce à la copie collaborative
    • Concepts associés : Innovation spillover, Japanese copying, Open source
  • Desperate Pivots : cas où l’urgence a conduit à un virage innovant
    • Concepts associés : Odeo reinvention, Startup pivot, Hindsight bias
  • Expert Intuition : l’expertise fonctionne comme un savoir intuitif qui dépasse la pensée consciente
    • Concepts associés : Tacit knowledge, Mētis knowledge, Intuition

Diversité des connexions de savoir

  • Les trails couvrent un large éventail de domaines comme la technologie, les organisations, la psychologie, l’économie et la créativité
    • Ex. : Proxy Trap (le piège de l’optimisation des indicateurs), Legibility Tax (le coût de la standardisation), Joy Dividend (la productivité du plaisir)
  • Chaque trail est composé de 3 à 4 mots-clés principaux, ce qui permet d’explorer intuitivement les relations entre les concepts
  • Grâce à une exploration visuelle et thématique, le lecteur peut relier les idées des livres dans de nouveaux contextes

Caractéristiques techniques

  • Claude Code analyse le contenu de chaque livre et génère des connexions à partir de la similarité sémantique
  • Le résultat est proposé via une interface basée sur des liens, permettant à l’utilisateur d’explorer par thème
  • Chaque page de trail se compose d’une courte phrase de résumé et de tags de concepts associés

Portée

  • Une tentative expérimentale dans laquelle l’IA explore automatiquement les relations structurelles du savoir
  • Un outil permettant aux lecteurs et aux chercheurs de relier des idées issues de domaines différents afin d’élargir leur réflexion
  • La combinaison de données issues des livres et d’une analyse par IA propose une nouvelle forme d’« expérience de lecture intégrative »

1 commentaires

 
GN⁺ 2026-01-11
Commentaires Hacker News
  • L’œuvre en elle-même est belle, mais les données produites semblent presque inutiles en pratique
    On a l’impression d’avoir délégué beaucoup trop de pensée critique à un modèle statistique
    J’ai moi aussi testé plusieurs LLM avancés pendant longtemps, mais trouver des « connexions invisibles » entre des textes reste impossible à ce stade. L’intuition humaine est toujours nécessaire

    • Ce serait plus utile si les liens se faisaient au niveau des concepts, plutôt qu’à partir d’un seul mot comme « Us/Them » ou « fictions »
    • J’aimerais regarder ça de plus près. Le trail collective-brain est excellent
    • J’ai construit beaucoup de textes avec du RAG et fait des extractions par mots-clés, lieux, dates, etc., mais sans reranker, le LLM n’arrivait pas à produire de bons résultats. Quand on lance une requête vectorielle, on obtient toujours une réponse, mais la plupart du temps elle contient des fragments sans rapport
  • C’est un travail vraiment impressionnant. Visuellement aussi, le niveau de finition est remarquable

  • C’est une excellente tentative, mais comme d’autres, je ne vois pas vraiment de liens substantiels entre les textes
    Par exemple, le lien entre Jobs et The Elephant in the Brain n’a pas été capté par le LLM, alors qu’un humain le repère facilement — les deux se ressemblent dans la façon dont l’auto-illusion fonctionne de manière stratégique

  • Le fait que l’expression « Thanos committing fraud » se trouve dans la section « useful lies » m’a perturbé
    Vu que la fondatrice est en prison, c’est étrange de considérer ce mensonge comme « utile ». On dirait une catégorisation bâclée par l’IA

    • Peut-être que cela veut dire que « c’était un mensonge utile jusqu’à ce qu’elle se fasse prendre »
    • Au passage, il semble qu’il soit question non pas de Thanos mais de Theranos
  • J’ai moi aussi fait une expérience avec Claude Code pour « lire » des projets GitHub que je connaissais mal
    En suivant un projet tendance en russe, je suis tombé sur GoodbyeDPI, ce qui m’a fait plonger dans l’univers du deep packet inspection

    • ValdikSS est connu pour son patch SBC XQ pour Android. Voir à ce sujet cet article Habr et ce lien vers une review Android
    • Il y a vraiment beaucoup de projets sur GitHub qui sont difficiles à comprendre sans connaissance du domaine
  • Je ne comprends pas les lignes qui relient les deux textes. Elles ressemblent pour la plupart à des liens dénués de sens
    Dans la section « Father wound », « abandoned at birth » est relié à « did not », ce qui donne l’impression d’un simple ornement visuel

    • J’ai eu exactement la même impression
    • C’est joli à regarder, mais au final ce sont des liens établis arbitrairement par le LLM
  • J’ai fait un projet similaire moi aussi
    J’ai extrait le texte de PDF avec pdfplumber, je l’ai mis dans PostgreSQL, puis j’ai fait du chunking par blocs de 100 caractères avant de générer des embeddings de 384 dimensions avec sentence_transformers
    Ensuite, j’ai appliqué UMAP + HDBScan pour la réduction de dimension et le clustering, puis visualisé le tout avec Plotly, et les clusters thématiques apparaissaient clairement
    J’ai configuré l’environnement avec Docker Compose et je l’ai déplacé vers une interface web basée sur Flask. Je prévois de le publier en open source après avoir nettoyé le code

    • J’aimerais vraiment voir l’approche et le dépôt
    • Ça ressemble à une approche proche de Bertopic. C’est une excellente bibliothèque
  • J’ai lu autrefois un livre lié aux « humanités numériques », et le concept de « distant reading » m’avait marqué
    Il s’agit d’analyser des centaines ou des milliers de textes avec un ordinateur pour en tirer des enseignements macroscopiques
    Un ami a directement implémenté ce type d’analyse en Python dans un article académique, et j’avais trouvé ça vraiment fascinant
    Aujourd’hui, grâce aux LLM, ce genre d’approche est devenu plus accessible, et on peut l’essayer même sans savoir coder
    Le concept est présenté sur le wiki Distant reading

    • Les LLM sont aussi assez utiles pour retrouver des ressources à partir de descriptions floues comme celle-ci ;)
  • L’idée est bonne, mais les liens entre les thèmes et les récits de chaque livre restent faibles
    Pour certains, on dirait que l’ensemble du thème a été inféré à partir d’un seul paragraphe
    En répétant plusieurs fois le prompt ou en ajoutant un processus d’extraction en plusieurs étapes, on obtiendrait sans doute quelque chose de plus précis

  • Comme dans une citation de Deleuze, on peut voir un livre soit comme une « machine qui fonctionne », soit comme une « boîte de sens »

    • Je ne connais pas la source, mais ça me semble une vision trop simplifiée
      Deleuze lui-même était un penseur influencé par d’autres, et je trouve justement que la tentative de ce projet a du sens
      Cela dit, pour quelqu’un qui a réellement lu les textes, le résultat peut paraître inexact