- Le système de mémoire de Claude ne s’active que lorsque l’utilisateur l’invoque explicitement, et renvoie des informations en recherchant en temps réel dans les véritables historiques de conversation
- À l’inverse, ChatGPT charge automatiquement le profil utilisateur et l’historique à chaque conversation, afin d’offrir immédiatement une expérience personnalisée
- Ces deux approches reflètent des différences de public cible et de philosophie de développement produit
- Les utilisateurs de Claude sont principalement des développeurs et des professionnels, qui privilégient la transparence, le contrôle direct et la protection de la vie privée
- Plus récemment, Claude a lui aussi introduit une fonction de mémoire automatique similaire à celle de ChatGPT pour les comptes équipe et entreprise, signe que le champ du design de la mémoire en IA s’étend rapidement
Fonctionnement du système de mémoire de Claude
Le système de mémoire de Claude repose sur deux caractéristiques clés
- Il démarre dans un état vide au début de chaque conversation, sans précharger le profil utilisateur ni les conversations précédentes
- La fonction mémoire ne s’active que lorsque l’utilisateur utilise des formulations d’appel explicites, comme « rappelle-moi ce dont on a parlé avant » ou « reprends à partir de la dernière fois »
Claude n’utilise pas un résumé généré par l’IA ni un profil compressé, mais recherche en temps réel uniquement les véritables conversations passées pour exploiter ces informations
Une fois la recherche terminée, Claude intègre les résultats pour répondre à la demande de l’utilisateur ou poursuivre la discussion
Outil Conversation Search
- L’outil conversation_search recherche dans l’historique complet des conversations par mot-clé ou par sujet
- Par exemple, si on lui demande « tu te souviens de ce qu’on avait dit à propos de Chandni Chowk ? », Claude retrouve plusieurs conversations liées à ce sujet, puis en fournit un résumé consolidé
- Si l’on pose simultanément des questions sur plusieurs sujets (par ex. Michelangelo, Chainflip, Solana), il effectue une recherche distincte et séquentielle pour chacun, puis renvoie le contenu correspondant avec des liens
- Les paramètres de
conversation_searchincluent notamment le nombre maximal de résultats et la requête de recherche- Ex. :
max_results(1 à 10),query(mot-clé de recherche)
- Ex. :
Outil Temporal Chat Retrieval
- L’outil recent_chats accède à l’historique des conversations selon un critère temporel
- Si on demande « donne-moi le contenu des 10 conversations les plus récentes », il retrouve les échanges les plus récents dans l’ordre, puis en fournit un résumé
- Il est aussi possible de rechercher par période précise, par exemple : « de quoi avons-nous parlé la dernière semaine de novembre 2024 ? »
- Les paramètres de
recent_chatscomprennentafter/before(début/fin de période),n(nombre de conversations, 1 à 20) etsort_order(ordre croissant/décroissant)
Comparaison entre ChatGPT et Claude
Jusqu’à l’an dernier, les principales fonctions offertes par ChatGPT et Claude se ressemblaient, mais aujourd’hui leur orientation produit a fortement divergé
- ChatGPT a évolué comme un produit grand public destiné au marché de masse, utilisé par des profils variés comme des étudiants, des parents ou des amateurs
- À chaque conversation, le composant mémoire est chargé automatiquement, offrant une expérience de personnalisation immédiate et sans effort
- À partir d’un profil utilisateur détaillé, il peut servir à recommander des fonctions futures, proposer des fonctions personnalisées et soutenir la monétisation
- Claude a été développé en ciblant surtout les développeurs, les ingénieurs et les professionnels
- Les utilisateurs comprennent le fonctionnement de l’algorithme et choisissent clairement quand invoquer la mémoire
- Plus que la profilisation ou l’automatisation, ils accordent davantage de valeur à la dimension utilitaire, à la prévisibilité et à la protection de la vie privée
Ainsi, les systèmes de mémoire de ces deux services reflètent directement les différences de public et de philosophie de développement
La diversité dans la conception de la mémoire pour l’IA
Les systèmes de mémoire diamétralement opposés de ChatGPT et Claude montrent à quel point le domaine de la conception de la mémoire pour l’IA est vaste et diversifié
- Il n’existe pas de bonne réponse ni de solution universelle en matière d’approche mémoire ; il est indispensable de concevoir le système à rebours des besoins et des objectifs réels des utilisateurs
- L’histoire de l’usage des outils d’IA ayant moins de trois ans, il n’existe pas encore de bonnes pratiques stabilisées pour la gestion des données accumulées ou de la vie privée lorsqu’on utilise longtemps le même assistant IA
- Aujourd’hui, diverses applications IA expérimentent chacune leur propre approche de la mémoire, tandis que les modèles sous-jacents gagnent en puissance semaine après semaine
- Dans ce contexte, il n’y a pas de réponse définitive sur la meilleure méthode, et les essais comme les expérimentations se poursuivent
Mise à jour récente : introduction de la mémoire automatique dans Claude
Le jour de la publication de cet article, Anthropic a annoncé la fonction de mémoire automatique de Claude pour les comptes équipe/entreprise
- Cette fonction, similaire à l’approche de ChatGPT, construit automatiquement des résumés mémoire à partir du contexte de travail, des habitudes de travail et des informations propres à chaque projet
- Une mémoire indépendante est créée pour chaque projet Claude, et l’utilisateur peut consulter et modifier directement ce dont Claude se souvient
- Cette fonction n’a pas encore été déployée sur l’abonnement personnel Pro Max de l’auteur, donc aucune évaluation n’est encore possible
- Un complément d’analyse est prévu plus tard sur la comparaison avec la mémoire existante fondée sur la recherche, ainsi que sur les différences avec ChatGPT
2 commentaires
Avis Hacker News
Les différences d’implémentation découlent au final d’objectifs business
ChatGPT vise clairement une monétisation via la publicité et les liens d’affiliation, et son implémentation de la mémoire se concentre aussi sur la création d’un profil utilisateur
À l’inverse, l’implémentation de la mémoire de Claude semble plus proche d’un objectif de long terme fondé sur les interactions passées et l’accès à des abstractions
Elle est conçue pour permettre de rechercher dans les conversations d’une manière semblable à la mémoire humaine, et l’on peut imaginer qu’à terme, via l’apprentissage par renforcement, elle puisse mémoriser les erreurs signalées par l’utilisateur ou extraire des abstractions à partir de conversations passées afin de traiter des tâches de manière proactive
En somme, ChatGPT cherche à se souvenir de l’utilisateur lui-même, tandis que Claude se concentre sur l’historique des interactions individuelles
J’ai l’impression qu’il y a un décalage entre le discours et les actes
OpenAI pourrait monétiser certains sujets comme b, c, f avec de la publicité interstitielle (plein écran, plus de 30 secondes)
Cela serait possible simplement en analysant les thèmes
Si OpenAI peut analyser environ 1000 sessions de chat et de code pour maximiser ses revenus en orientant l’utilisateur vers un emploi dans une entreprise donnée ou vers l’achat d’une voiture chez une autre, alors elle pourrait, dans ce processus, ajuster non seulement la publicité interstitielle mais aussi la qualité ou le contenu des réponses
C’est un scénario à la fois très réaliste et dystopique
À l’inverse, si DeepSeek fonctionne sans publicité, le seuil à atteindre pour que les LLM closed source gagnent des parts de marché sera bien plus élevé
Au final, les LLM seront comme tous les produits : les utilisateurs paieront selon la qualité, et chacun voudra un niveau de qualité différent
Comme la publicité peut nuire à la fiabilité des réponses de l’IA, je pense que les pubs plein écran sont l’issue la plus réaliste
ChatGPT n’est pas un réseau social, donc il n’a pas besoin d’être monétisé de la même manière
Il génère déjà largement assez de revenus via les abonnements, l’enterprise, les offres business et l’API
Fait remarquer que le lien vers le billet d’analyse de l’implémentation de la mémoire de ChatGPT est incorrect, et partage le bon lien
Je me demandais justement comment la mémoire de ChatGPT était implémentée, et voir une approche totalement différente de celle de Claude est très intéressant
L’approche de Claude semble mieux adaptée à la résolution de problèmes techniques, tandis que ChatGPT paraît avantagé pour les conversations du quotidien et l’intégration publicitaire
Un jour, ces approches de mémoire fondées sur le langage paraîtront probablement dépassées, et quelqu’un finira par trouver une méthode de stockage/récupération de souvenirs encodés qui dépasse l’expression linguistique
Ce sera peut-être la dernière percée vers l’AGI
Les LLM actuels ne comprennent pas les concepts ; en réalité, ils ne disposent pas de la fonction même de « compréhension » et ne sont fondamentalement que des chaînes de Markov sophistiquées
Je pense qu’une véritable intelligence est une condition préalable à l’AGI
On dirait que la mémoire de ChatGPT permet seulement d’injecter dans le contexte la vraie Memory, c’est-à-dire des résumés par entité
Et l’idée est aussi avancée que les résumés de conversations passées ou les embeddings peuvent eux aussi être considérés comme des formes de stockage de mémoire encodée
Cela amène à se demander comment on pourrait faire en sorte qu’une AGI obéisse aux instructions
Dit être satisfait de l’implémentation de la mémoire de Claude, mais avoir désactivé celle de ChatGPT
Comme il l’utilise pour trop de choses différentes, le fait qu’il essaie d’établir des liens entre des contenus sans rapport lui paraissait étrange
Je veux de la personnalisation et la possibilité de me référer aux informations nécessaires
Par exemple, si je lui fais mémoriser les informations d’un projet, je n’ai plus besoin de réexpliquer le contexte à chaque fois ensuite, ce qui améliore énormément la qualité de vie
En revanche, je n’aime pas beaucoup la façon dont il crée en arrière-plan des souvenirs de conversation sans que je puisse les contrôler directement
Dans ChatGPT, des éléments d’anciennes conversations non souhaités se mélangent inutilement, ce qui est peu utile
J’ai essayé plusieurs tuteurs IA pour l’apprentissage des langues, et ChatGPT était le meilleur
Mais je devais sans cesse lui redemander de « parler lentement », et même si je lui disais d’appliquer cette règle à toute la conversation, c’était impossible
Il y a aussi d’autres cas où la mémoire ne fonctionne pas correctement
La façon dont fonctionne la mémoire de ChatGPT va bientôt changer
Liens de référence : X.com - annonce sur les changements de mémoire, annonce officielle d’Anthropic
Partage son expérience d’avoir lui-même écrit un billet sur la mémoire de ChatGPT et l’historique des chats
Il contient aussi un prompt de dump d’informations direct
Lien connexe
Je désactive complètement la mémoire, car je veux toujours un contrôle précis des entrées
Je voudrais retirer tous les system prompts, l’entraînement, etc., et n’utiliser que les prompts que j’ai moi-même écrits
Je me demande si les informations obtenues en interrogeant directement ChatGPT sont fiables, ou si ce n’est qu’une hallucination générative
Je ne vois pas pourquoi un LLM saurait comment il fonctionne lui-même, ni pourquoi on lui aurait fourni de telles données d’entraînement
Parce que ces informations sur les outils sont décrites avec énormément de détails dans le system prompt
Claude ne rappelle ses souvenirs qu’en se référant à l’historique brut des conversations
Il fait une recherche en temps réel uniquement dans les vraies conversations passées, sans résumé généré par l’IA ni profil compressé
L’absence de résumés, de profils, de graphe de connaissances, etc., ne signifie pas que c’est une fonction experte, mais plutôt que cela ne fonctionne pas très bien
Par exemple, il se souviendra peut-être de quelque chose de précis comme « Chandni Chowk », mais il ne retrouvera pas correctement une expression ambiguë comme « mon collègue avec qui il y avait eu un problème »
Demande quels sont les obstacles à l’utilisation d’un magasin de mémoire externe via le tool calling ou MCP
S’interroge sur l’usage du RL pour renforcer les schémas d’utilisation de la mémoire
Du point de vue de la confidentialité des données, le LLM finira de toute façon par connaître l’information au moment de l’inférence, mais je ne veux pas forcément la saisir directement
Exemple : « centres d’intérêt : MacOS, bondage, discipline, Baseball »
À l’époque, Claude rechignait à utiliser spontanément la mémoire, même en le poussant sans arrêt via le prompt
Il fallait explicitement lui demander à chaque fois de vérifier ou d’enregistrer un souvenir, ce qui limitait fortement l’utilité de l’ensemble
Dépôt connexe
J’ai été déconcerté en lisant ce billet
Il n’est pas clair si l’auteur pense que des prompts sont injectés même lorsque la mémoire est désactivée
Dans mon cas, quand la mémoire est désactivée, il n’y a absolument aucune métadonnée injectant des conversations récentes ou des informations de préférence, et les conversations restent totalement indépendantes
Je ne sais pas si le fait d’avoir activé puis désactivé la mémoire pendant l’expérience a créé la confusion, ou si c’est moi qui ai mal lu le billet
Soudain, tous les points ont disparu.