Encyclopédie personnelle

(whoami.wiki)

18 points par GN⁺ 2026-03-26 | 1 commentaires | Partager sur WhatsApp

En triant 1 351 photos de famille découvertes chez sa grand-mère, l’auteur a créé un wiki personnel basé sur MediaWiki pour structurer ses souvenirs
En reliant photos, personnes et événements sous forme de wiki, il a reconstitué l’histoire familiale et personnelle sous forme d’articles
Il a ensuite intégré diverses traces numériques comme Google Photos, l’historique de localisation, les transactions financières et les données de reconnaissance musicale, et a expérimenté la génération automatique de pages avec Claude Code et des modèles de langage
Au fil du processus, le modèle a comblé les blancs de la mémoire et réorganisé le fil des conversations, des voyages et des amitiés en récit fondé sur les données
Le tout a finalement évolué en projet open source whoami.wiki, qui propose un système permettant à chacun d’explorer et de posséder ses propres données comme une encyclopédie

Début du projet d’encyclopédie personnelle

Lors d’une première visite chez sa grand-mère après la pandémie, l’auteur a découvert 1 351 anciennes photos et a commencé à les classer
- Elles couvraient une période allant de la jeunesse de ses grands-parents jusqu’à ses années de collège
- Le tri initial s’est fait selon des caractéristiques physiques comme le type de pellicule ou le format des photos
En les organisant, des fragments de souvenirs lui sont revenus, sans ordre clair ni contexte précis
- Comme il s’agissait de photos prises avant l’existence des métadonnées EXIF, il était difficile d’en reconstituer la chronologie
En réorganisant les photos avec sa grand-mère, il a recueilli ses souvenirs oraux du mariage
- Il a noté les noms des personnes et les événements, et a pu identifier certains proches sur des clichés de jeunesse
Il a mis ces notes en forme en lançant MediaWiki en local, puis en les éditant dans le format réel de Wikipédia
- Il a rédigé des pages structurées avec infobox, corps de texte, légendes de photos et liens vers les personnes
- Des éléments connexes comme des réformes juridiques, des rituels ou des lieux ont été reliés à de véritables pages Wikipédia

Recomposer les souvenirs avec un logiciel de wiki

En deux jours, il a transformé le contexte historique des photos en articles aboutis
- Cela lui a fait prendre conscience que le logiciel de wiki est un outil puissant pour préserver le savoir et les médias
Au fil des mois suivants, il a étendu ce travail à l’ensemble des photos de famille sous forme de pages wiki
- Il a amélioré sa manière de consigner l’histoire orale grâce aux conseils de la communauté r/genealogy
- Il a aussi utilisé la transcription vocale et des modèles de langage pour accélérer l’édition
Le format wiki lui a permis d’identifier facilement les liens entre événements et personnes
- Il a par exemple découvert que la chanteuse présente au mariage de ses grands-parents était aussi l’infirmière qui l’avait mis au monde

Combiner données numériques et modèles de langage

Il a ensuite étendu l’expérience aux photos numériques de Google Photos
- Les métadonnées EXIF permettaient cette fois d’utiliser la date, l’heure et les informations de lieu
Pour un voyage familial de 2012 et ses 625 photos, il a demandé à Claude Code de générer des pages wiki
- Le modèle explorait les images à partir de planches-contact créées avec ImageMagick
- À partir des seules informations visuelles et des horodatages, il a reconstitué les lieux et les activités
- Les brouillons incluaient des détails sur les moyens de transport, les lieux visités et l’identification des personnes
L’auteur a ensuite complété le récit en ajoutant sa propre liste d’anecdotes

Expériences d’intégration de données composites

Le projet a encore été étendu aux données d’un voyage à Mexico en 2022
- Il y a intégré 291 photos, 343 vidéos, ainsi que l’historique de localisation Google Maps, les trajets Uber, les transactions bancaires et l’historique Shazam
Principales tâches réalisées par Claude Code
1. Croiser les transactions bancaires et les données de localisation pour identifier les restaurants visités
2. Utiliser les paiements de billets pour retrouver les équipes et le nom de la compétition d’un match de football
3. Exploiter l’historique des trajets Uber pour reconstituer les heures et lieux de déplacement
4. S’appuyer sur l’historique Shazam pour décrire les genres musicaux selon les lieux
5. Repérer dans les images vidéo une scène de guitare pendant un dîner et l’insérer dans la page
Il a conservé les fonctions natives de MediaWiki comme les pages de discussion, les catégories et l’historique des modifications
- À chaque nouvelle donnée ajoutée, les changements s’accumulaient comme dans le travail d’un véritable contributeur wiki

Mettre les données personnelles en forme d’encyclopédie

Avec le temps, le modèle a commencé à combler les trous de mémoire
- En croisant plusieurs sources de données, il a pu restaurer des faits oubliés
L’auteur a aussi analysé environ 100 000 messages et notes vocales issus de ses archives Facebook, Instagram et WhatsApp
- À partir des conversations avec ses amis, il a extrait l’évolution des amitiés et des événements de vie pour en faire des pages
- Ses amis, en lisant ces pages, se sont montrés suffisamment captivés pour tout parcourir en détail
Le projet a ainsi dépassé le cadre d’une simple histoire familiale pour devenir une encyclopédie personnelle (personal encyclopedia)
- Il constitue désormais un système d’auto-archivage structuré et interconnecté fondé sur les données

Publication du projet whoami.wiki

Fort de cette expérience, l’auteur a publié whoami.wiki en open source
- Basé sur MediaWiki, il génère automatiquement des pages wiki à partir de données personnelles
- L’utilisateur fournit ses exports de données et le modèle de langage rédige un brouillon
- Le système garantit une exécution en local, la conservation de la propriété des données et l’indépendance vis-à-vis du modèle
Tous les sujets personnels, du mariage aux amis en passant par les voyages, peuvent être documentés dans le même format qu’un wiki public
Explorer les pages produites procure un plaisir qui rappelle les débuts de la timeline Facebook
Plus encore que la technologie, l’essentiel est la redécouverte des personnes et des souvenirs
- En documentant la vie de sa grand-mère, l’auteur a redécouvert sa force et sa résilience
- En revenant sur ses relations amicales, il a retrouvé de la gratitude et un sentiment de lien
Le projet en est encore à ses débuts, et tout le monde peut se lancer directement via la documentation d’installation
- Les données restent la propriété de l’utilisateur et leur structure peut être lue par n’importe quel modèle
- Le projet continue de s’améliorer grâce aux retours de ses collaborateurs

1 commentaires

GN⁺ 2026-03-26

Avis sur Hacker News

Je trouve ce projet vraiment formidable, et c’est une manière intéressante de préserver l’histoire d’une famille
Mais j’ai ressenti quelque chose d’émotionnellement ambivalent dans la partie impliquant l’IA
Il y avait une certaine amertume, comme si le travail artisanal se faisait écraser par l’usine, et en même temps voir l’IA croiser des relevés bancaires, des tickets et même des historiques musicaux avait quelque chose d’un peu dystopique
Malgré tout, dans l’ensemble, c’était une tentative extrêmement impressionnante
- Merci :)
  Au début, je faisais moi-même toutes les éditions et j’assemblais les documents comme un historien
  Ensuite, j’ai commencé des expériences avec des agents, ce qui a énormément accéléré le travail, mais j’ai quand même passé du temps comme un « contributeur de wiki » à réfléchir à ce qu’il fallait garder ou supprimer
  En même temps, cette expérience m’a fait prendre très concrètement conscience de l’importance de protéger les données personnelles. Nous laissons beaucoup trop de traces numériques
- D’habitude, l’IA qui imite les humains me met mal à l’aise, mais ici c’était différent
  Comme le « vélo de l’esprit » dont parlait Steve Jobs, la technologie a fonctionné comme un outil au service du travail humain
  Ça faisait longtemps que je n’avais pas retrouvé cette excitation en voyant la technologie aider une création humaine
- Je pense pareil. C’est excellent comme dispositif de cadrage pour raconter une histoire familiale, mais l’idée que l’IA devienne la narratrice me provoque instinctivement un rejet
  Qu’un LLM organise l’information ne pose pas de problème moral, mais voir le modèle d’une grande entreprise parler à la place d’un récit personnel me met mal à l’aise
- Ici, l’IA m’a semblé être simplement une collaboratrice
  L’auteur s’occupait des parties intéressantes, et l’IA des liaisons de données ennuyeuses ; je trouve cette répartition des rôles idéale
- J’ai eu exactement la même réaction. Le fait de documenter directement les membres de la famille et les événements est formidable, mais si l’IA fait tout à la place de la personne, tout son charme disparaît
  1. On perd le geste de la curation
  2. La subjectivité du souvenir est essentielle, et l’IA essaie de la corriger
  3. Au final, on obtient un résultat sans âme
Avec ma femme, chaque Nouvel An, nous relions une cinquantaine de feuilles pour faire un petit carnet
Nous le relions avec de vieux tissus usés et le décorons avec des objets-souvenirs comme des boîtes d’allumettes rapportées de voyage
Nous y écrivons ce que nous avons appris pendant l’année, nos disputes et nos réconciliations, des recettes de cuisine, des réflexions, et cela devient une archive de cette année-là
Si nous écrivons à la main au lieu d’utiliser des outils d’IA, c’est parce que le processus est un rituel significatif et joyeux
Et c’est encore plus beau en pensant que nos enfants le liront plus tard
- Je fais quelque chose de similaire : j’imprime des photos avec une imprimante Instax et je les colle dans mon journal
  Comme les vieux livres de recettes patinés par l’usage, les livres avec des traces d’éclaboussures de peinture ont plus de charme
- On appelle ça un commonplace book. Jillian Hess a beaucoup travaillé sur le sujet
- C’est une très belle idée, j’aimerais essayer avec ma femme et mes enfants
- C’est touchant, mais honnêtement je n’aurais probablement pas autant d’énergie
Moi aussi, j’ai commencé ce genre de projet avec de vrais livres imprimés
Je mets en page des milliers de photos avec Scribus pour créer des livres par année
J’aime l’idée qu’il reste une trace physique de moi après ma mort
Je compte fixer une carte SD au début du livre pour laisser aussi des vidéos
Et j’ai aussi trouvé une Canon Selphy d’occasion pour imprimer des photos à la maison. Les couleurs ne sont pas parfaites, mais les voir accrochées au mur me rend fier
- J’aime faire des zines. L’impression laser résiste longtemps même au soleil, et le crayon tient le plus longtemps de tout
  Une agrafeuse 360° est idéale pour une reliure rapide
- Je fais quelque chose de semblable par e-mail. Quand mon fils est né, j’ai créé une adresse e-mail pour que la famille puisse lui envoyer des messages et des photos
  C’est un projet d’héritage numérique qu’il pourra lire à ses 18 ans
  L’article correspondant est ici
- Je suis curieux du coût de fabrication des livres. Le faire soi-même revient moins cher, mais en ce moment je manque de temps
- J’aimerais essayer moi aussi. Pourrais-tu partager des modèles ou des conseils ?
- J’ai entendu dire que les cartes SD ne duraient pas très longtemps. Que penserais-tu de conserver certaines vidéos sous forme de flipbook ?
J’aime faire des recherches généalogiques. J’ai retracé des ancêtres arrivés en Argentine jusqu’à 10 générations en arrière (environ 250 ans)
Côté européen, c’est beaucoup plus compliqué à cause des guerres et de la perte des archives
Récemment, je recueille des vieux récits de membres âgés de la famille sous forme de messages vocaux, puis je les organise
Je pense qu’il serait bien de tout structurer sous forme de wiki avec l’arbre généalogique créé par mon père
- Dix générations, c’est impressionnant. Je serais curieux de savoir de quels pays venaient tes ancêtres
Chaque année, ma femme sélectionne les photos de notre compte partagé pour en faire un livre de 50 pages
Nous avons maintenant 12 ans d’archives annuelles, et cela devient un ensemble de souvenirs que l’on peut feuilleter à la main
Elle fait aussi ce travail pour d’autres personnes, et cela rencontre un grand succès grâce à sa touche personnelle
Le projet en lui-même est formidable, mais avec les API de LLM, la confidentialité est essentielle
Je n’ai pas envie de confier mes photos au modèle d’une entreprise américaine
- Il existe des alternatives comme confer.to
- Les relevés bancaires m’inquiètent plus que les photos
- L’auteur a déjà publié les photos sur son blog, donc il ne semble pas les considérer comme secrètes
- Il existe peut-être des alternatives comme PPQ.AI, OpenRouter.AI ou encore Apple on-device AI
- Dans ce cas, serais-tu prêt à les confier à des LLM d’entreprises chinoises, russes ou européennes ?
La combinaison d’entretiens familiaux et d’un workflow avec LLM est vraiment un bon cas d’usage
Mais exporter jusqu’à l’historique de localisation Google Maps, Uber, les transactions bancaires et Shazam, là, j’ai l’impression qu’on dépasse la limite
On voit beaucoup de projets d’IA qui promettent aujourd’hui que « les données restent sur mon appareil », mais en réalité le parcours des données manque souvent de clarté
J’ai l’impression que les utilisateurs ne comprennent pas suffisamment ce compromis
Même si c’est « privé par défaut », dans les faits les données sont envoyées sur les serveurs d’une entreprise d’IA
Si les LLM locaux ne sont pas pris en charge, la formulation sur la confidentialité devrait être plus claire
Le passage expliquant que les données Google Maps, Uber, bancaires et Shazam ont été confiées à une IA m’a mis mal à l’aise
Le projet lui-même est excellent, mais il est risqué de confier à un service les données les plus sensibles
Il y aura toujours une possibilité de fuite un jour
- Moi, ça ne me met pas mal à l’aise. Simplement, ce genre d’obsession pour ses propres données (quantified self) ne m’intéresse pas
  Préserver les histoires de famille m’intéresse, mais pas l’auto-analyse
L’idée est bonne, mais la vraie question est de savoir jusqu’où partager
Quand on est seul à consulter, on peut tout consigner, mais quand la famille lit aussi, il y a des histoires sensibles
- Je suis d’accord. Et en plus, tout ça est envoyé sur les serveurs d’Anthropic
  Consigner le passé sombre d’une famille ou ses conflits peut relever de l’atteinte à la vie privée
  Guerre, prison, héritage : chacun a ses propres souvenirs et ses propres émotions
  Si une IA tisse tout cela ensemble, il ne restera qu’une illusion d’objectivité, et cela peut rouvrir des blessures familiales
  Au fond, je pense que les souvenirs ont naturellement un cycle de vie de l’oubli
  Les personnes fascinées par la technologie passent souvent à côté de cette complexité humaine
- Au final, c’est mon wiki, donc j’en fais ce que je veux

Encyclopédie personnelle

Début du projet d’encyclopédie personnelle

Recomposer les souvenirs avec un logiciel de wiki

Combiner données numériques et modèles de langage

Expériences d’intégration de données composites

Mettre les données personnelles en forme d’encyclopédie

Publication du projet whoami.wiki

À lire aussi

1 commentaires

Avis sur Hacker News