L’architecture mémoire de Claude est à l’opposé de celle de ChatGPT

(shloked.com)

6 points par GN⁺ 2025-09-12 | 2 commentaires | Partager sur WhatsApp

Le système de mémoire de Claude ne s’active que lorsque l’utilisateur l’invoque explicitement, et renvoie des informations en recherchant en temps réel dans les véritables historiques de conversation
À l’inverse, ChatGPT charge automatiquement le profil utilisateur et l’historique à chaque conversation, afin d’offrir immédiatement une expérience personnalisée
Ces deux approches reflètent des différences de public cible et de philosophie de développement produit
Les utilisateurs de Claude sont principalement des développeurs et des professionnels, qui privilégient la transparence, le contrôle direct et la protection de la vie privée
Plus récemment, Claude a lui aussi introduit une fonction de mémoire automatique similaire à celle de ChatGPT pour les comptes équipe et entreprise, signe que le champ du design de la mémoire en IA s’étend rapidement

Fonctionnement du système de mémoire de Claude

Le système de mémoire de Claude repose sur deux caractéristiques clés

Il démarre dans un état vide au début de chaque conversation, sans précharger le profil utilisateur ni les conversations précédentes
La fonction mémoire ne s’active que lorsque l’utilisateur utilise des formulations d’appel explicites, comme « rappelle-moi ce dont on a parlé avant » ou « reprends à partir de la dernière fois »

Claude n’utilise pas un résumé généré par l’IA ni un profil compressé, mais recherche en temps réel uniquement les véritables conversations passées pour exploiter ces informations
Une fois la recherche terminée, Claude intègre les résultats pour répondre à la demande de l’utilisateur ou poursuivre la discussion

Outil Conversation Search

L’outil conversation_search recherche dans l’historique complet des conversations par mot-clé ou par sujet
Par exemple, si on lui demande « tu te souviens de ce qu’on avait dit à propos de Chandni Chowk ? », Claude retrouve plusieurs conversations liées à ce sujet, puis en fournit un résumé consolidé
Si l’on pose simultanément des questions sur plusieurs sujets (par ex. Michelangelo, Chainflip, Solana), il effectue une recherche distincte et séquentielle pour chacun, puis renvoie le contenu correspondant avec des liens
Les paramètres de conversation_search incluent notamment le nombre maximal de résultats et la requête de recherche
- Ex. : max_results (1 à 10), query (mot-clé de recherche)

Outil Temporal Chat Retrieval

L’outil recent_chats accède à l’historique des conversations selon un critère temporel
Si on demande « donne-moi le contenu des 10 conversations les plus récentes », il retrouve les échanges les plus récents dans l’ordre, puis en fournit un résumé
Il est aussi possible de rechercher par période précise, par exemple : « de quoi avons-nous parlé la dernière semaine de novembre 2024 ? »
Les paramètres de recent_chats comprennent after/before (début/fin de période), n (nombre de conversations, 1 à 20) et sort_order (ordre croissant/décroissant)

Comparaison entre ChatGPT et Claude

Jusqu’à l’an dernier, les principales fonctions offertes par ChatGPT et Claude se ressemblaient, mais aujourd’hui leur orientation produit a fortement divergé

ChatGPT a évolué comme un produit grand public destiné au marché de masse, utilisé par des profils variés comme des étudiants, des parents ou des amateurs
- À chaque conversation, le composant mémoire est chargé automatiquement, offrant une expérience de personnalisation immédiate et sans effort
- À partir d’un profil utilisateur détaillé, il peut servir à recommander des fonctions futures, proposer des fonctions personnalisées et soutenir la monétisation
Claude a été développé en ciblant surtout les développeurs, les ingénieurs et les professionnels
- Les utilisateurs comprennent le fonctionnement de l’algorithme et choisissent clairement quand invoquer la mémoire
- Plus que la profilisation ou l’automatisation, ils accordent davantage de valeur à la dimension utilitaire, à la prévisibilité et à la protection de la vie privée

Ainsi, les systèmes de mémoire de ces deux services reflètent directement les différences de public et de philosophie de développement

La diversité dans la conception de la mémoire pour l’IA

Les systèmes de mémoire diamétralement opposés de ChatGPT et Claude montrent à quel point le domaine de la conception de la mémoire pour l’IA est vaste et diversifié

Il n’existe pas de bonne réponse ni de solution universelle en matière d’approche mémoire ; il est indispensable de concevoir le système à rebours des besoins et des objectifs réels des utilisateurs
L’histoire de l’usage des outils d’IA ayant moins de trois ans, il n’existe pas encore de bonnes pratiques stabilisées pour la gestion des données accumulées ou de la vie privée lorsqu’on utilise longtemps le même assistant IA
Aujourd’hui, diverses applications IA expérimentent chacune leur propre approche de la mémoire, tandis que les modèles sous-jacents gagnent en puissance semaine après semaine
Dans ce contexte, il n’y a pas de réponse définitive sur la meilleure méthode, et les essais comme les expérimentations se poursuivent

Mise à jour récente : introduction de la mémoire automatique dans Claude

Le jour de la publication de cet article, Anthropic a annoncé la fonction de mémoire automatique de Claude pour les comptes équipe/entreprise

Cette fonction, similaire à l’approche de ChatGPT, construit automatiquement des résumés mémoire à partir du contexte de travail, des habitudes de travail et des informations propres à chaque projet
Une mémoire indépendante est créée pour chaque projet Claude, et l’utilisateur peut consulter et modifier directement ce dont Claude se souvient
Cette fonction n’a pas encore été déployée sur l’abonnement personnel Pro Max de l’auteur, donc aucune évaluation n’est encore possible
Un complément d’analyse est prévu plus tard sur la comparaison avec la mémoire existante fondée sur la recherche, ainsi que sur les différences avec ChatGPT

2 commentaires

GN⁺ 2025-09-12

Avis Hacker News

Les différences d’implémentation découlent au final d’objectifs business
ChatGPT vise clairement une monétisation via la publicité et les liens d’affiliation, et son implémentation de la mémoire se concentre aussi sur la création d’un profil utilisateur
À l’inverse, l’implémentation de la mémoire de Claude semble plus proche d’un objectif de long terme fondé sur les interactions passées et l’accès à des abstractions
Elle est conçue pour permettre de rechercher dans les conversations d’une manière semblable à la mémoire humaine, et l’on peut imaginer qu’à terme, via l’apprentissage par renforcement, elle puisse mémoriser les erreurs signalées par l’utilisateur ou extraire des abstractions à partir de conversations passées afin de traiter des tâches de manière proactive
En somme, ChatGPT cherche à se souvenir de l’utilisateur lui-même, tandis que Claude se concentre sur l’historique des interactions individuelles
- Une AGI pourrait sans doute générer des revenus sans publicité, mais une nouvelle entreprise de type Google a besoin de publicité
  J’ai l’impression qu’il y a un décalage entre le discours et les actes
- Je ne crois pas non plus qu’Anthropic ne proposera jamais de publicité personnalisée
- Si l’on suppose qu’un utilisateur emploie souvent un LLM pour les sujets a, b, c et moins souvent pour d, e, f
  OpenAI pourrait monétiser certains sujets comme b, c, f avec de la publicité interstitielle (plein écran, plus de 30 secondes)
  Cela serait possible simplement en analysant les thèmes
  Si OpenAI peut analyser environ 1000 sessions de chat et de code pour maximiser ses revenus en orientant l’utilisateur vers un emploi dans une entreprise donnée ou vers l’achat d’une voiture chez une autre, alors elle pourrait, dans ce processus, ajuster non seulement la publicité interstitielle mais aussi la qualité ou le contenu des réponses
  C’est un scénario à la fois très réaliste et dystopique
  À l’inverse, si DeepSeek fonctionne sans publicité, le seuil à atteindre pour que les LLM closed source gagnent des parts de marché sera bien plus élevé
  Au final, les LLM seront comme tous les produits : les utilisateurs paieront selon la qualité, et chacun voudra un niveau de qualité différent
  Comme la publicité peut nuire à la fiabilité des réponses de l’IA, je pense que les pubs plein écran sont l’issue la plus réaliste
- Je me demande pourquoi tu vois une trajectoire aussi claire vers la publicité
  ChatGPT n’est pas un réseau social, donc il n’a pas besoin d’être monétisé de la même manière
  Il génère déjà largement assez de revenus via les abonnements, l’enterprise, les offres business et l’API
Fait remarquer que le lien vers le billet d’analyse de l’implémentation de la mémoire de ChatGPT est incorrect, et partage le bon lien
Je me demandais justement comment la mémoire de ChatGPT était implémentée, et voir une approche totalement différente de celle de Claude est très intéressant
L’approche de Claude semble mieux adaptée à la résolution de problèmes techniques, tandis que ChatGPT paraît avantagé pour les conversations du quotidien et l’intégration publicitaire
Un jour, ces approches de mémoire fondées sur le langage paraîtront probablement dépassées, et quelqu’un finira par trouver une méthode de stockage/récupération de souvenirs encodés qui dépasse l’expression linguistique
Ce sera peut-être la dernière percée vers l’AGI
- Je ne suis pas d’accord avec l’idée que ce serait la dernière percée vers l’AGI
  Les LLM actuels ne comprennent pas les concepts ; en réalité, ils ne disposent pas de la fonction même de « compréhension » et ne sont fondamentalement que des chaînes de Markov sophistiquées
  Je pense qu’une véritable intelligence est une condition préalable à l’AGI
- Je pense que la liste des conversations récentes est similaire à Claude dans la mesure où elle n’est pas une vraie mémoire, mais une forme de compression des conversations, consultée uniquement en cas de besoin
  On dirait que la mémoire de ChatGPT permet seulement d’injecter dans le contexte la vraie Memory, c’est-à-dire des résumés par entité
- Comme ChatGPT cherche à couvrir aussi bien les conversations du quotidien que les tâches techniques, cette stratégie fonctionne plutôt bien
  Et l’idée est aussi avancée que les résumés de conversations passées ou les embeddings peuvent eux aussi être considérés comme des formes de stockage de mémoire encodée
- Je ne veux pas d’AGI
  Cela amène à se demander comment on pourrait faire en sorte qu’une AGI obéisse aux instructions
Dit être satisfait de l’implémentation de la mémoire de Claude, mais avoir désactivé celle de ChatGPT
Comme il l’utilise pour trop de choses différentes, le fait qu’il essaie d’établir des liens entre des contenus sans rapport lui paraissait étrange
- La mémoire de ChatGPT est sa fonction la plus pratique, et c’est ce qui me fait continuer à l’utiliser
  Je veux de la personnalisation et la possibilité de me référer aux informations nécessaires
  Par exemple, si je lui fais mémoriser les informations d’un projet, je n’ai plus besoin de réexpliquer le contexte à chaque fois ensuite, ce qui améliore énormément la qualité de vie
  En revanche, je n’aime pas beaucoup la façon dont il crée en arrière-plan des souvenirs de conversation sans que je puisse les contrôler directement
- À l’inverse, le fait que ChatGPT aille automatiquement chercher des informations dans la mémoire me paraît bien plus pratique
- Si j’ai désactivé la mémoire, c’est parce qu’il avait auparavant retenu de fausses informations, puis les rappelait sans cesse
- Je trouve précieux de pouvoir contrôler à quel moment il rappelle le contenu d’anciennes conversations
  Dans ChatGPT, des éléments d’anciennes conversations non souhaités se mélangent inutilement, ce qui est peu utile
- C’est étonnant que ChatGPT ne soit même pas capable de se souvenir des choses les plus élémentaires
  J’ai essayé plusieurs tuteurs IA pour l’apprentissage des langues, et ChatGPT était le meilleur
  Mais je devais sans cesse lui redemander de « parler lentement », et même si je lui disais d’appliquer cette règle à toute la conversation, c’était impossible
  Il y a aussi d’autres cas où la mémoire ne fonctionne pas correctement
La façon dont fonctionne la mémoire de ChatGPT va bientôt changer
Liens de référence : X.com - annonce sur les changements de mémoire, annonce officielle d’Anthropic
- Si le système de mémoire change, ce serait dommage
Partage son expérience d’avoir lui-même écrit un billet sur la mémoire de ChatGPT et l’historique des chats
Il contient aussi un prompt de dump d’informations direct
Lien connexe
Je désactive complètement la mémoire, car je veux toujours un contrôle précis des entrées
Je voudrais retirer tous les system prompts, l’entraînement, etc., et n’utiliser que les prompts que j’ai moi-même écrits
Je me demande si les informations obtenues en interrogeant directement ChatGPT sont fiables, ou si ce n’est qu’une hallucination générative
Je ne vois pas pourquoi un LLM saurait comment il fonctionne lui-même, ni pourquoi on lui aurait fourni de telles données d’entraînement
- Demander à un LLM comment il fonctionne n’aide pas beaucoup, mais lui demander la signature des fonctions/outils qu’il peut utiliser est au contraire assez fiable
  Parce que ces informations sur les outils sont décrites avec énormément de détails dans le system prompt
Claude ne rappelle ses souvenirs qu’en se référant à l’historique brut des conversations
Il fait une recherche en temps réel uniquement dans les vraies conversations passées, sans résumé généré par l’IA ni profil compressé
L’absence de résumés, de profils, de graphe de connaissances, etc., ne signifie pas que c’est une fonction experte, mais plutôt que cela ne fonctionne pas très bien
Par exemple, il se souviendra peut-être de quelque chose de précis comme « Chandni Chowk », mais il ne retrouvera pas correctement une expression ambiguë comme « mon collègue avec qui il y avait eu un problème »
Demande quels sont les obstacles à l’utilisation d’un magasin de mémoire externe via le tool calling ou MCP
S’interroge sur l’usage du RL pour renforcer les schémas d’utilisation de la mémoire
Du point de vue de la confidentialité des données, le LLM finira de toute façon par connaître l’information au moment de l’inférence, mais je ne veux pas forcément la saisir directement
Exemple : « centres d’intérêt : MacOS, bondage, discipline, Baseball »
- Raconte avoir créé au printemps, pour s’amuser, un outil MCP stockant la mémoire dans une base SQLite
  À l’époque, Claude rechignait à utiliser spontanément la mémoire, même en le poussant sans arrêt via le prompt
  Il fallait explicitement lui demander à chaque fois de vérifier ou d’enregistrer un souvenir, ce qui limitait fortement l’utilité de l’ensemble
  Dépôt connexe
J’ai été déconcerté en lisant ce billet
Il n’est pas clair si l’auteur pense que des prompts sont injectés même lorsque la mémoire est désactivée
Dans mon cas, quand la mémoire est désactivée, il n’y a absolument aucune métadonnée injectant des conversations récentes ou des informations de préférence, et les conversations restent totalement indépendantes
Je ne sais pas si le fait d’avoir activé puis désactivé la mémoire pendant l’expérience a créé la confusion, ou si c’est moi qui ai mal lu le billet

roxie 2025-09-13

Soudain, tous les points ont disparu.