Trails - découvrir les connexions entre 100 livres avec Claude Code
(trails.pieterma.es)- Projet web utilisant Claude Code pour explorer automatiquement les relations entre thèmes dans 100 livres
- Analyse les concepts de chaque livre et les visualise sous forme de plus de 40 connexions thématiques (trails), comme « Useful Lies », « Invisible Crack » et « Name Game »
- Chaque trail relie de manière transversale des concepts issus de domaines variés comme la psychologie, la technologie, les organisations, la créativité et la pensée systémique
- L’utilisateur peut cliquer sur chaque trail pour explorer les livres associés et les concepts clés correspondants (ex. : Self-deception, Innovation, Tacit knowledge)
- Propose une nouvelle manière de lire et de faire de la recherche, où l’IA explore de façon structurelle les relations entre les connaissances
Vue d’ensemble du projet
- Trails est un système qui utilise Claude Code pour analyser le contenu de plusieurs livres et en dégager automatiquement des thèmes communs ou des connexions conceptuelles
- Le site web est accessible sur trails.pieterma.es
- Le fonctionnement du projet est détaillé sur une page dédiée (explainer)
- Le résultat visualise les liens thématiques entre les livres sous la forme de « trails »
- Chaque trail relie les idées de plusieurs livres autour d’un concept donné
Exemples de trails principaux
- Useful Lies : traite du comportement humain qui utilise l’auto-illusion comme stratégie
- Concepts associés : Self-deception, Evolutionary psychology, Blue lies
- Invisible Crack : phénomène où de minuscules défauts s’accumulent jusqu’à provoquer un échec catastrophique
- Concepts associés : Brittle fracture, Metal fatigue, Gradual change
- Ideas Mate : une propriété intellectuelle peu contraignante accélère l’innovation grâce à la copie collaborative
- Concepts associés : Innovation spillover, Japanese copying, Open source
- Desperate Pivots : cas où l’urgence a conduit à un virage innovant
- Concepts associés : Odeo reinvention, Startup pivot, Hindsight bias
- Expert Intuition : l’expertise fonctionne comme un savoir intuitif qui dépasse la pensée consciente
- Concepts associés : Tacit knowledge, Mētis knowledge, Intuition
Diversité des connexions de savoir
- Les trails couvrent un large éventail de domaines comme la technologie, les organisations, la psychologie, l’économie et la créativité
- Ex. : Proxy Trap (le piège de l’optimisation des indicateurs), Legibility Tax (le coût de la standardisation), Joy Dividend (la productivité du plaisir)
- Chaque trail est composé de 3 à 4 mots-clés principaux, ce qui permet d’explorer intuitivement les relations entre les concepts
- Grâce à une exploration visuelle et thématique, le lecteur peut relier les idées des livres dans de nouveaux contextes
Caractéristiques techniques
- Claude Code analyse le contenu de chaque livre et génère des connexions à partir de la similarité sémantique
- Le résultat est proposé via une interface basée sur des liens, permettant à l’utilisateur d’explorer par thème
- Chaque page de trail se compose d’une courte phrase de résumé et de tags de concepts associés
Portée
- Une tentative expérimentale dans laquelle l’IA explore automatiquement les relations structurelles du savoir
- Un outil permettant aux lecteurs et aux chercheurs de relier des idées issues de domaines différents afin d’élargir leur réflexion
- La combinaison de données issues des livres et d’une analyse par IA propose une nouvelle forme d’« expérience de lecture intégrative »
1 commentaires
Commentaires Hacker News
L’œuvre en elle-même est belle, mais les données produites semblent presque inutiles en pratique
On a l’impression d’avoir délégué beaucoup trop de pensée critique à un modèle statistique
J’ai moi aussi testé plusieurs LLM avancés pendant longtemps, mais trouver des « connexions invisibles » entre des textes reste impossible à ce stade. L’intuition humaine est toujours nécessaire
C’est un travail vraiment impressionnant. Visuellement aussi, le niveau de finition est remarquable
C’est une excellente tentative, mais comme d’autres, je ne vois pas vraiment de liens substantiels entre les textes
Par exemple, le lien entre Jobs et The Elephant in the Brain n’a pas été capté par le LLM, alors qu’un humain le repère facilement — les deux se ressemblent dans la façon dont l’auto-illusion fonctionne de manière stratégique
Le fait que l’expression « Thanos committing fraud » se trouve dans la section « useful lies » m’a perturbé
Vu que la fondatrice est en prison, c’est étrange de considérer ce mensonge comme « utile ». On dirait une catégorisation bâclée par l’IA
J’ai moi aussi fait une expérience avec Claude Code pour « lire » des projets GitHub que je connaissais mal
En suivant un projet tendance en russe, je suis tombé sur GoodbyeDPI, ce qui m’a fait plonger dans l’univers du deep packet inspection
Je ne comprends pas les lignes qui relient les deux textes. Elles ressemblent pour la plupart à des liens dénués de sens
Dans la section « Father wound », « abandoned at birth » est relié à « did not », ce qui donne l’impression d’un simple ornement visuel
J’ai fait un projet similaire moi aussi
J’ai extrait le texte de PDF avec pdfplumber, je l’ai mis dans PostgreSQL, puis j’ai fait du chunking par blocs de 100 caractères avant de générer des embeddings de 384 dimensions avec sentence_transformers
Ensuite, j’ai appliqué UMAP + HDBScan pour la réduction de dimension et le clustering, puis visualisé le tout avec Plotly, et les clusters thématiques apparaissaient clairement
J’ai configuré l’environnement avec Docker Compose et je l’ai déplacé vers une interface web basée sur Flask. Je prévois de le publier en open source après avoir nettoyé le code
J’ai lu autrefois un livre lié aux « humanités numériques », et le concept de « distant reading » m’avait marqué
Il s’agit d’analyser des centaines ou des milliers de textes avec un ordinateur pour en tirer des enseignements macroscopiques
Un ami a directement implémenté ce type d’analyse en Python dans un article académique, et j’avais trouvé ça vraiment fascinant
Aujourd’hui, grâce aux LLM, ce genre d’approche est devenu plus accessible, et on peut l’essayer même sans savoir coder
Le concept est présenté sur le wiki Distant reading
L’idée est bonne, mais les liens entre les thèmes et les récits de chaque livre restent faibles
Pour certains, on dirait que l’ensemble du thème a été inféré à partir d’un seul paragraphe
En répétant plusieurs fois le prompt ou en ajoutant un processus d’extraction en plusieurs étapes, on obtiendrait sans doute quelque chose de plus précis
Comme dans une citation de Deleuze, on peut voir un livre soit comme une « machine qui fonctionne », soit comme une « boîte de sens »
Deleuze lui-même était un penseur influencé par d’autres, et je trouve justement que la tentative de ce projet a du sens
Cela dit, pour quelqu’un qui a réellement lu les textes, le résultat peut paraître inexact