18 points par GN⁺ 2026-03-26 | 1 commentaires | Partager sur WhatsApp
  • En triant 1 351 photos de famille découvertes chez sa grand-mère, l’auteur a créé un wiki personnel basé sur MediaWiki pour structurer ses souvenirs
  • En reliant photos, personnes et événements sous forme de wiki, il a reconstitué l’histoire familiale et personnelle sous forme d’articles
  • Il a ensuite intégré diverses traces numériques comme Google Photos, l’historique de localisation, les transactions financières et les données de reconnaissance musicale, et a expérimenté la génération automatique de pages avec Claude Code et des modèles de langage
  • Au fil du processus, le modèle a comblé les blancs de la mémoire et réorganisé le fil des conversations, des voyages et des amitiés en récit fondé sur les données
  • Le tout a finalement évolué en projet open source whoami.wiki, qui propose un système permettant à chacun d’explorer et de posséder ses propres données comme une encyclopédie

Début du projet d’encyclopédie personnelle

  • Lors d’une première visite chez sa grand-mère après la pandémie, l’auteur a découvert 1 351 anciennes photos et a commencé à les classer
    • Elles couvraient une période allant de la jeunesse de ses grands-parents jusqu’à ses années de collège
    • Le tri initial s’est fait selon des caractéristiques physiques comme le type de pellicule ou le format des photos
  • En les organisant, des fragments de souvenirs lui sont revenus, sans ordre clair ni contexte précis
    • Comme il s’agissait de photos prises avant l’existence des métadonnées EXIF, il était difficile d’en reconstituer la chronologie
  • En réorganisant les photos avec sa grand-mère, il a recueilli ses souvenirs oraux du mariage
    • Il a noté les noms des personnes et les événements, et a pu identifier certains proches sur des clichés de jeunesse
  • Il a mis ces notes en forme en lançant MediaWiki en local, puis en les éditant dans le format réel de Wikipédia
    • Il a rédigé des pages structurées avec infobox, corps de texte, légendes de photos et liens vers les personnes
    • Des éléments connexes comme des réformes juridiques, des rituels ou des lieux ont été reliés à de véritables pages Wikipédia

Recomposer les souvenirs avec un logiciel de wiki

  • En deux jours, il a transformé le contexte historique des photos en articles aboutis
    • Cela lui a fait prendre conscience que le logiciel de wiki est un outil puissant pour préserver le savoir et les médias
  • Au fil des mois suivants, il a étendu ce travail à l’ensemble des photos de famille sous forme de pages wiki
    • Il a amélioré sa manière de consigner l’histoire orale grâce aux conseils de la communauté r/genealogy
    • Il a aussi utilisé la transcription vocale et des modèles de langage pour accélérer l’édition
  • Le format wiki lui a permis d’identifier facilement les liens entre événements et personnes
    • Il a par exemple découvert que la chanteuse présente au mariage de ses grands-parents était aussi l’infirmière qui l’avait mis au monde

Combiner données numériques et modèles de langage

  • Il a ensuite étendu l’expérience aux photos numériques de Google Photos
    • Les métadonnées EXIF permettaient cette fois d’utiliser la date, l’heure et les informations de lieu
  • Pour un voyage familial de 2012 et ses 625 photos, il a demandé à Claude Code de générer des pages wiki
    • Le modèle explorait les images à partir de planches-contact créées avec ImageMagick
    • À partir des seules informations visuelles et des horodatages, il a reconstitué les lieux et les activités
    • Les brouillons incluaient des détails sur les moyens de transport, les lieux visités et l’identification des personnes
  • L’auteur a ensuite complété le récit en ajoutant sa propre liste d’anecdotes

Expériences d’intégration de données composites

  • Le projet a encore été étendu aux données d’un voyage à Mexico en 2022
    • Il y a intégré 291 photos, 343 vidéos, ainsi que l’historique de localisation Google Maps, les trajets Uber, les transactions bancaires et l’historique Shazam
  • Principales tâches réalisées par Claude Code
    1. Croiser les transactions bancaires et les données de localisation pour identifier les restaurants visités
    2. Utiliser les paiements de billets pour retrouver les équipes et le nom de la compétition d’un match de football
    3. Exploiter l’historique des trajets Uber pour reconstituer les heures et lieux de déplacement
    4. S’appuyer sur l’historique Shazam pour décrire les genres musicaux selon les lieux
    5. Repérer dans les images vidéo une scène de guitare pendant un dîner et l’insérer dans la page
  • Il a conservé les fonctions natives de MediaWiki comme les pages de discussion, les catégories et l’historique des modifications
    • À chaque nouvelle donnée ajoutée, les changements s’accumulaient comme dans le travail d’un véritable contributeur wiki

Mettre les données personnelles en forme d’encyclopédie

  • Avec le temps, le modèle a commencé à combler les trous de mémoire
    • En croisant plusieurs sources de données, il a pu restaurer des faits oubliés
  • L’auteur a aussi analysé environ 100 000 messages et notes vocales issus de ses archives Facebook, Instagram et WhatsApp
    • À partir des conversations avec ses amis, il a extrait l’évolution des amitiés et des événements de vie pour en faire des pages
    • Ses amis, en lisant ces pages, se sont montrés suffisamment captivés pour tout parcourir en détail
  • Le projet a ainsi dépassé le cadre d’une simple histoire familiale pour devenir une encyclopédie personnelle (personal encyclopedia)
    • Il constitue désormais un système d’auto-archivage structuré et interconnecté fondé sur les données

Publication du projet whoami.wiki

  • Fort de cette expérience, l’auteur a publié whoami.wiki en open source
    • Basé sur MediaWiki, il génère automatiquement des pages wiki à partir de données personnelles
    • L’utilisateur fournit ses exports de données et le modèle de langage rédige un brouillon
    • Le système garantit une exécution en local, la conservation de la propriété des données et l’indépendance vis-à-vis du modèle
  • Tous les sujets personnels, du mariage aux amis en passant par les voyages, peuvent être documentés dans le même format qu’un wiki public
  • Explorer les pages produites procure un plaisir qui rappelle les débuts de la timeline Facebook
  • Plus encore que la technologie, l’essentiel est la redécouverte des personnes et des souvenirs
    • En documentant la vie de sa grand-mère, l’auteur a redécouvert sa force et sa résilience
    • En revenant sur ses relations amicales, il a retrouvé de la gratitude et un sentiment de lien
  • Le projet en est encore à ses débuts, et tout le monde peut se lancer directement via la documentation d’installation
    • Les données restent la propriété de l’utilisateur et leur structure peut être lue par n’importe quel modèle
    • Le projet continue de s’améliorer grâce aux retours de ses collaborateurs

1 commentaires

 
GN⁺ 2026-03-26
Avis sur Hacker News
  • Je trouve ce projet vraiment formidable, et c’est une manière intéressante de préserver l’histoire d’une famille
    Mais j’ai ressenti quelque chose d’émotionnellement ambivalent dans la partie impliquant l’IA
    Il y avait une certaine amertume, comme si le travail artisanal se faisait écraser par l’usine, et en même temps voir l’IA croiser des relevés bancaires, des tickets et même des historiques musicaux avait quelque chose d’un peu dystopique
    Malgré tout, dans l’ensemble, c’était une tentative extrêmement impressionnante

    • Merci :)
      Au début, je faisais moi-même toutes les éditions et j’assemblais les documents comme un historien
      Ensuite, j’ai commencé des expériences avec des agents, ce qui a énormément accéléré le travail, mais j’ai quand même passé du temps comme un « contributeur de wiki » à réfléchir à ce qu’il fallait garder ou supprimer
      En même temps, cette expérience m’a fait prendre très concrètement conscience de l’importance de protéger les données personnelles. Nous laissons beaucoup trop de traces numériques
    • D’habitude, l’IA qui imite les humains me met mal à l’aise, mais ici c’était différent
      Comme le « vélo de l’esprit » dont parlait Steve Jobs, la technologie a fonctionné comme un outil au service du travail humain
      Ça faisait longtemps que je n’avais pas retrouvé cette excitation en voyant la technologie aider une création humaine
    • Je pense pareil. C’est excellent comme dispositif de cadrage pour raconter une histoire familiale, mais l’idée que l’IA devienne la narratrice me provoque instinctivement un rejet
      Qu’un LLM organise l’information ne pose pas de problème moral, mais voir le modèle d’une grande entreprise parler à la place d’un récit personnel me met mal à l’aise
    • Ici, l’IA m’a semblé être simplement une collaboratrice
      L’auteur s’occupait des parties intéressantes, et l’IA des liaisons de données ennuyeuses ; je trouve cette répartition des rôles idéale
    • J’ai eu exactement la même réaction. Le fait de documenter directement les membres de la famille et les événements est formidable, mais si l’IA fait tout à la place de la personne, tout son charme disparaît
      1. On perd le geste de la curation
      2. La subjectivité du souvenir est essentielle, et l’IA essaie de la corriger
      3. Au final, on obtient un résultat sans âme
  • Avec ma femme, chaque Nouvel An, nous relions une cinquantaine de feuilles pour faire un petit carnet
    Nous le relions avec de vieux tissus usés et le décorons avec des objets-souvenirs comme des boîtes d’allumettes rapportées de voyage
    Nous y écrivons ce que nous avons appris pendant l’année, nos disputes et nos réconciliations, des recettes de cuisine, des réflexions, et cela devient une archive de cette année-là
    Si nous écrivons à la main au lieu d’utiliser des outils d’IA, c’est parce que le processus est un rituel significatif et joyeux
    Et c’est encore plus beau en pensant que nos enfants le liront plus tard

    • Je fais quelque chose de similaire : j’imprime des photos avec une imprimante Instax et je les colle dans mon journal
      Comme les vieux livres de recettes patinés par l’usage, les livres avec des traces d’éclaboussures de peinture ont plus de charme
    • On appelle ça un commonplace book. Jillian Hess a beaucoup travaillé sur le sujet
    • C’est une très belle idée, j’aimerais essayer avec ma femme et mes enfants
    • C’est touchant, mais honnêtement je n’aurais probablement pas autant d’énergie
  • Moi aussi, j’ai commencé ce genre de projet avec de vrais livres imprimés
    Je mets en page des milliers de photos avec Scribus pour créer des livres par année
    J’aime l’idée qu’il reste une trace physique de moi après ma mort
    Je compte fixer une carte SD au début du livre pour laisser aussi des vidéos
    Et j’ai aussi trouvé une Canon Selphy d’occasion pour imprimer des photos à la maison. Les couleurs ne sont pas parfaites, mais les voir accrochées au mur me rend fier

    • J’aime faire des zines. L’impression laser résiste longtemps même au soleil, et le crayon tient le plus longtemps de tout
      Une agrafeuse 360° est idéale pour une reliure rapide
    • Je fais quelque chose de semblable par e-mail. Quand mon fils est né, j’ai créé une adresse e-mail pour que la famille puisse lui envoyer des messages et des photos
      C’est un projet d’héritage numérique qu’il pourra lire à ses 18 ans
      L’article correspondant est ici
    • Je suis curieux du coût de fabrication des livres. Le faire soi-même revient moins cher, mais en ce moment je manque de temps
    • J’aimerais essayer moi aussi. Pourrais-tu partager des modèles ou des conseils ?
    • J’ai entendu dire que les cartes SD ne duraient pas très longtemps. Que penserais-tu de conserver certaines vidéos sous forme de flipbook ?
  • J’aime faire des recherches généalogiques. J’ai retracé des ancêtres arrivés en Argentine jusqu’à 10 générations en arrière (environ 250 ans)
    Côté européen, c’est beaucoup plus compliqué à cause des guerres et de la perte des archives
    Récemment, je recueille des vieux récits de membres âgés de la famille sous forme de messages vocaux, puis je les organise
    Je pense qu’il serait bien de tout structurer sous forme de wiki avec l’arbre généalogique créé par mon père

    • Dix générations, c’est impressionnant. Je serais curieux de savoir de quels pays venaient tes ancêtres
  • Chaque année, ma femme sélectionne les photos de notre compte partagé pour en faire un livre de 50 pages
    Nous avons maintenant 12 ans d’archives annuelles, et cela devient un ensemble de souvenirs que l’on peut feuilleter à la main
    Elle fait aussi ce travail pour d’autres personnes, et cela rencontre un grand succès grâce à sa touche personnelle

  • Le projet en lui-même est formidable, mais avec les API de LLM, la confidentialité est essentielle
    Je n’ai pas envie de confier mes photos au modèle d’une entreprise américaine

    • Il existe des alternatives comme confer.to
    • Les relevés bancaires m’inquiètent plus que les photos
    • L’auteur a déjà publié les photos sur son blog, donc il ne semble pas les considérer comme secrètes
    • Il existe peut-être des alternatives comme PPQ.AI, OpenRouter.AI ou encore Apple on-device AI
    • Dans ce cas, serais-tu prêt à les confier à des LLM d’entreprises chinoises, russes ou européennes ?
  • La combinaison d’entretiens familiaux et d’un workflow avec LLM est vraiment un bon cas d’usage
    Mais exporter jusqu’à l’historique de localisation Google Maps, Uber, les transactions bancaires et Shazam, là, j’ai l’impression qu’on dépasse la limite
    On voit beaucoup de projets d’IA qui promettent aujourd’hui que « les données restent sur mon appareil », mais en réalité le parcours des données manque souvent de clarté
    J’ai l’impression que les utilisateurs ne comprennent pas suffisamment ce compromis

  • Même si c’est « privé par défaut », dans les faits les données sont envoyées sur les serveurs d’une entreprise d’IA
    Si les LLM locaux ne sont pas pris en charge, la formulation sur la confidentialité devrait être plus claire

  • Le passage expliquant que les données Google Maps, Uber, bancaires et Shazam ont été confiées à une IA m’a mis mal à l’aise
    Le projet lui-même est excellent, mais il est risqué de confier à un service les données les plus sensibles
    Il y aura toujours une possibilité de fuite un jour

    • Moi, ça ne me met pas mal à l’aise. Simplement, ce genre d’obsession pour ses propres données (quantified self) ne m’intéresse pas
      Préserver les histoires de famille m’intéresse, mais pas l’auto-analyse
  • L’idée est bonne, mais la vraie question est de savoir jusqu’où partager
    Quand on est seul à consulter, on peut tout consigner, mais quand la famille lit aussi, il y a des histoires sensibles

    • Je suis d’accord. Et en plus, tout ça est envoyé sur les serveurs d’Anthropic
      Consigner le passé sombre d’une famille ou ses conflits peut relever de l’atteinte à la vie privée
      Guerre, prison, héritage : chacun a ses propres souvenirs et ses propres émotions
      Si une IA tisse tout cela ensemble, il ne restera qu’une illusion d’objectivité, et cela peut rouvrir des blessures familiales
      Au fond, je pense que les souvenirs ont naturellement un cycle de vie de l’oubli
      Les personnes fascinées par la technologie passent souvent à côté de cette complexité humaine
    • Au final, c’est mon wiki, donc j’en fais ce que je veux