Changements du prompt système entre Claude Opus 4.6 et 4.7

(simonwillison.net)

6 points par GN⁺ 2026-04-20 | 1 commentaires | Partager sur WhatsApp

Anthropic est le seul grand laboratoire d’IA à avoir publié le prompt système de son système de chat, et Opus 4.7, lancé le 16 avril 2026, apporte une mise à jour notable de ce prompt
L’appellation devient Claude Platform, et Claude in Chrome, Claude in Excel et Claude in Powerpoint sont ajoutés à la liste des outils ; une consigne indique aussi qu’en cas de demande à laquelle il manque seulement des détails mineurs, Claude doit essayer immédiatement au lieu de commencer par poser des questions
La section sur la sécurité des enfants a été largement étendue et encapsulée dans une nouvelle balise <critical_child_safety_instructions> ; après un premier refus pour motif de sécurité des enfants, toutes les demandes suivantes dans la même conversation doivent être traitées avec une extrême prudence
Une nouvelle section <acting_vs_clarifying> a été ajoutée pour indiquer que, lorsque l’utilisateur ne précise pas les détails, Claude doit d’abord faire une tentative raisonnable plutôt que poser une question
Si l’utilisateur exprime son souhait de mettre fin à la conversation, Claude doit désormais s’arrêter sans inciter à poursuivre l’échange ; pour les sujets complexes ou controversés, une règle supplémentaire privilégie les réponses nuancées et évite les réponses réduites à un simple oui/non
Le prompt précise aussi qu’avant d’affirmer qu’un accès est impossible, Claude doit d’abord vérifier les outils disponibles via tool_search ; le prompt public ne suffit pas à lui seul, et les descriptions d’outils restent un élément clé pour comprendre le comportement de Claude chat

Changements du prompt système de Claude Opus 4.6 à 4.7

Anthropic est le seul grand laboratoire d’IA à publier le prompt système du chat destiné aux utilisateurs, avec des archives qui remontent jusqu’à Claude 3 en juillet 2024
Opus 4.7 a été publié le 16 avril 2026 et, dans la foulée, le prompt système de Claude.ai a lui aussi été mis à jour après la version Opus 4.6
Une version Markdown des prompts système a été séparée dans une documentation par modèle, puis un historique Git a été reconstitué à l’aide de fausses dates de commit correspondant aux dates de publication, afin de comparer le diff entre Opus 4.6 et 4.7
Les éléments ci-dessous proviennent de ce diff, et les passages en gras correspondent aux mises en évidence présentes dans le texte source
Changements de nom et de liste d’outils
- L’appellation “developer platform” est remplacée par “Claude Platform”
- La liste des outils Claude mentionnés dans le prompt système inclut désormais Claude in Chrome, Claude in Excel et Claude in Powerpoint
  - D’après la formulation du texte source, Claude in Chrome est un agent de navigation capable d’interagir de manière autonome avec des sites web
  - Claude in Excel est un agent pour tableurs
  - Claude in Powerpoint est un agent pour présentations
  - Claude Cowork peut tous les utiliser comme outils
- Claude in Powerpoint n’était pas mentionné dans le prompt 4.6
Extension des consignes de sécurité pour les enfants
- La section sur la sécurité des enfants a été considérablement étendue et entourée d’une nouvelle balise <critical_child_safety_instructions>
- En particulier, une consigne a été ajoutée : après avoir refusé une demande pour des raisons de sécurité des enfants, toutes les requêtes suivantes dans la même conversation doivent être traitées avec une extrême prudence
Fin de conversation et évolution du ton des réponses
- Si l’utilisateur indique qu’il est prêt à terminer la conversation, Claude doit désormais respecter cette volonté d’arrêt sans demander à continuer l’échange ni chercher à provoquer un tour supplémentaire
- Le texte source interprète ce changement comme une manière de rendre Claude moins insistant
Ajout de la section acting_vs_clarifying
- Une nouvelle section <acting_vs_clarifying> a été ajoutée
- Lorsqu’il manque seulement des détails mineurs à une requête, cette section considère que l’utilisateur préfère généralement que Claude fasse tout de suite une tentative raisonnable plutôt que de l’interroger d’abord
- Claude ne doit poser une question préalable que lorsqu’il est réellement impossible de répondre sans l’information manquante
  - L’exemple donné est celui d’une pièce jointe inexistante à laquelle la requête fait référence
- S’il existe un outil capable de lever l’ambiguïté ou de fournir l’information manquante — par exemple pour une recherche, une localisation, une vérification d’agenda ou l’exploration des fonctionnalités disponibles — Claude doit privilégier l’appel d’outil plutôt que demander à l’utilisateur de faire lui-même la vérification
- Une fois la tâche commencée, Claude est explicitement invité à poursuivre jusqu’à une réponse complète sans s’arrêter en cours de route
Introduction de tool_search
- Le texte indique qu’un mécanisme tool_search semble avoir été introduit dans Claude chat
- À l’appui, il renvoie à la documentation API et à un billet publié en novembre 2025
- D’après la formulation du prompt système, avant de conclure qu’il n’a pas accès à la localisation, à la mémoire, au calendrier, aux fichiers, aux conversations passées ou à des données externes, Claude doit appeler tool_search pour vérifier si un outil pertinent est disponible mais retardé
- L’expression “I don’t have access to X” n’est considérée appropriée qu’après confirmation par tool_search qu’aucun outil correspondant n’existe
Renforcement de la concision
- Une nouvelle consigne indique que Claude doit garder ses réponses ciblées et concises afin d’éviter de submerger l’utilisateur avec des réponses trop longues
- Même si la réponse contient des réserves ou avertissements, ceux-ci doivent être formulés brièvement, et l’essentiel de la réponse doit rester centré sur la réponse principale
Formulations présentes en 4.6 mais supprimées en 4.7
- Certaines consignes du prompt 4.6 ont été retirées en 4.7
- Plus précisément, la consigne demandant d’éviter les émotes ou descriptions d’actions entre astérisques, sauf si l’utilisateur demandait explicitement ce style, a été supprimée
- La consigne d’éviter des mots comme “genuinely”, “honestly” ou “straightforward” a elle aussi disparu
- Le texte source ajoute que cela pourrait s’expliquer par le fait que le nouveau modèle ne dysfonctionne plus de la même manière, mais il s’agit d’une hypothèse formulée explicitement comme telle
Nouvelles consignes sur les troubles alimentaires
- Une nouvelle section sur le disordered eating a été ajoutée ; auparavant, cette notion n’était pas mentionnée explicitement
- Si un utilisateur présente des signes de trouble alimentaire, Claude ne doit pas non plus fournir, dans d’autres parties de la conversation, de consignes précises sur la nutrition, le régime ou l’exercice
- Les chiffres détaillés, objectifs précis et plans étape par étape sont tous interdits
- Le prompt précise que même avec l’intention d’aider à fixer des objectifs plus sains ou de souligner les risques, ce type de détails peut déclencher ou encourager des comportements liés aux troubles alimentaires
Prévention des réponses brèves aux questions controversées
- Le texte mentionne la popularité d’attaques par capture d’écran visant à forcer le modèle à répondre uniquement par oui/non à des questions controversées
- La section <evenhandedness> du prompt système contient des consignes de défense à ce sujet
- Si on demande à Claude de commenter une question complexe ou controversée, ou une personnalité controversée, sous la forme d’un simple oui/non ou d’un mot unique, Claude peut refuser cette réponse courte et fournir à la place une réponse nuancée, en expliquant pourquoi une réponse brève n’est pas appropriée
Suppression de la formulation de correction concernant Donald Trump
- Claude 4.6 comportait une formulation de correction explicite : “Donald Trump is the current president of the United States and was inaugurated on January 20, 2025”
- Selon le texte source, en raison de l’ancienne date de coupure des connaissances et des connaissances préexistantes sur l’élection de 2020, le modèle pouvait sinon nier qu’il soit président
- En 4.7, cette formulation a été retirée, car la nouvelle date de coupure des connaissances fiable du modèle a été mise à jour à janvier 2026

Les descriptions d’outils sont aussi un élément clé du suivi des changements

Le prompt système public ne suffit pas à lui seul à donner une vue d’ensemble complète
Les informations publiées par Anthropic n’incluent pas les descriptions d’outils fournies au modèle
Pour comprendre pleinement l’interface de chat Claude, ces descriptions d’outils peuvent constituer un fragment de documentation encore plus important
Résultat d’une interrogation directe de Claude
- Une requête a été adressée à Claude pour qu’il énumère tous les outils disponibles, ainsi que la description exacte et les paramètres de chacun
- L’historique de conversation partagé contient tous les détails, tandis que le corps de l’article ne reprend séparément que la liste des outils nommés
Liste des outils identifiés
- ask_user_input_v0
- bash_tool
- conversation_search
- create_file
- fetch_sports_data
- image_search
- message_compose_v1
- places_map_display_v0
- places_search
- present_files
- recent_chats
- recipe_display_v0
- recommend_claude_apps
- search_mcp_registry
- str_replace
- suggest_connectors
- view
- weather_fetch
- web_fetch
- web_search
- tool_search
- visualize:read_me
- visualize:show_widget
Évolution par rapport à Opus 4.6
- Cette liste d’outils semble ne pas avoir changé depuis Opus 4.6

1 commentaires

GN⁺ 2026-04-20

Commentaires Hacker News

J’ai toujours trouvé agaçante la tendance du modèle à commencer par faire des suppositions raisonnables quand les détails de la demande sont absents. Je préfère de loin qu’il pose d’abord des questions avant d’essayer quoi que ce soit, donc j’ai été assez surpris de voir ce principe ajouté au système
- Moi, j’ai carrément mis en place une étape d’entretien obligatoire. Le modèle doit impérativement m’interviewer, créer ensuite un fichier d’entretien qui contient tout, puis inclure ce fichier comme livrable dans le fichier de plan. Comme ça, l’intention ne se perd pas dans l’historique du chat
- Récemment, j’ai commencé à mettre dans mes prompts des formules du genre « si tu ne sais pas, ne suppose pas, demande ». Depuis, j’ai nettement moins souvent besoin de faire revenir le modèle en arrière ou de lui redemander quelque chose. Je lui demande aussi d’expliquer d’abord ce qu’il compte faire et d’obtenir mon approbation, parce que d’autres agents ont déjà fait des erreurs. C’est pénible, mais le fait de le faire expliquer, corriger ses erreurs et recommencer jusqu’à arriver à la bonne conclusion améliore énormément la qualité de sortie
- Je me suis demandé si ce n’était pas lié à une optimisation de métriques de façade. Si on expose l’ambiguïté très tôt via des questions, la session peut s’arrêter prématurément, et ça peut avoir l’air mauvais dans les statistiques d’usage. Mais pour moi, c’est bien pire de découvrir trop tard, en relisant un gros livrable, que la spécification était gravement incomplète. L’une des principales raisons pour lesquelles j’utilise aujourd’hui ces outils de façon plus détendue qu’avant, c’est justement qu’ils m’aident à faire le travail préliminaire au début ; au fond, la conversation elle-même est essentielle
- Je ne comprenais pas pourquoi ça essayait sans arrêt de faire des réponses en one-shot, mais en fait la raison était dans le prompt système. Ça explique aussi pourquoi je n’arrivais pas à corriger ce comportement, même avec un prompt « système » côté utilisateur
- D’habitude, je dois rappeler au modèle environ cinq fois d’agir exactement à l’inverse. Sinon, il prend des décisions que je ne veux pas ou qui sont nuisibles au projet. Si même Claude Code a cette tendance, ça risque d’être assez pénible. Du coup, je demande explicitement des questions de suivi, surtout des questions qui proposent plusieurs options, mais ces instructions sont souvent ignorées, ce qui dégrade le résultat, voire le rend dangereux
J’ai l’impression qu’à force d’ajouter tout et n’importe quoi dans le prompt système, on finit par créer de la non-conversation. Plus l’équipe grandit, plus il y a forcément quelqu’un qui veut ajouter au prompt ce qu’il juge important sur le moment
Je trouve la section sur les troubles alimentaires assez excessive. Je me demandais si, à l’avenir, on allait continuer à ajouter une section comme ça pour chacun des comportements humains jugés « mauvais »
- À choisir, je préfère encore que ce soit dans le prompt système. Pour l’instant, on voit au moins un peu ce qui est censuré, alors que si plus tard c’est intégré directement dans le modèle via le post-training, il sera encore plus difficile de comprendre pourquoi une question comme « combien de calories dans 100 g de pâtes » reçoit un « je ne peux pas fournir cette information »
- Ça me fait penser à ces mentions de sécurité exagérées collées partout. En pire que des avertissements du type « n’appuyez pas l’échelle contre une ligne à haute tension », parce qu’un humain peut les ignorer selon le contexte, alors que Claude ne le peut pas. Vu sous un bon angle, c’est frustrant ; vu sous un mauvais angle, ça limite l’utilité de l’outil
- Je trouve au contraire que cette partie est un ajout de bon sens. En pratique, recommander l’obsession calorique ou le micro-pilotage d’un régime à quelqu’un qui a un trouble alimentaire peut aggraver la situation. Un conseil banal pour l’utilisateur moyen peut être nocif pour quelqu’un d’autre, donc je ne pense pas que cette formulation provoquera en elle-même des refus excessifs
- Vu autrement, on peut dire que tous les utilisateurs de Claude paient une taxe supplémentaire sur chaque requête
- Quand la valorisation d’une entreprise atteint des centaines de milliards de dollars, il est normal que les gens cherchant à intenter des procès affluent. On voit déjà des signes en ce sens, donc dépenser 50 millions de dollars pour une équipe chargée de filtrer les contenus potentiellement problématiques devient un choix parfaitement rationnel
Je suis fortement opposé à l’instruction « garder les réponses courtes et ciblées ». J’utilise Claude sur des projets bas niveau, et les réponses longues évitent des erreurs stupides tout en servant aussi de support d’apprentissage. Ce n’est pas quelque chose qu’Anthropic devrait fixer en dur ; le prompt système devrait plutôt être modulaire et laisser le choix
- Je suis d’accord aussi. Ce genre de prompt système verbeux est au fond conçu pour l’utilisateur plus petit dénominateur commun, donc pour ceux qui veulent aller plus loin, ça agit comme un nerf qui dégrade les performances
- Même avis, et pour du travail bas niveau, je recommande de lancer des tests aussi vite que possible et de vérifier soi-même les informations obtenues pendant l’apprentissage afin de construire une compréhension de base solide
J’ai l’impression qu’on est arrivé au point où l’amélioration dans un domaine entraîne une régression dans un autre. Il y a des aspects où la 4.7 est meilleure et d’autres où la 4.6 l’est, donc je m’attends à ce qu’on aille bientôt vers quelque chose comme une séparation des personnalités
Je me demandais pourquoi la 4.7 était à ce point obsédée par l’évitement des malwares. Le prompt système a l’air similaire, donc je me demande si Anthropic ne testerait pas déjà des choses comme l’injection de steering vectors. Notre entreprise est une société de services financiers tout à fait banale, et pourtant la 4.7 dépense beaucoup trop de tokens à se demander si tel code ou telle tâche a un rapport avec des malwares, avec un comportement qui paraît suffisamment décalé pour qu’on l’ait temporairement bloquée dans l’IDE. Une fois, j’ai eu l’impression que le modèle refusait délibérément d’effectuer une certaine tâche, et quand j’ai demandé pourquoi, la sortie de l’outil montrait qu’il essayait de suivre des consignes liées aux malwares. Je sais que l’auto-déclaration du modèle n’est pas très fiable, mais dans ce cas-là je ne lui avais même pas donné d’indice au préalable. En ligne, surtout sur reddit, on voit aussi beaucoup de remarques similaires sur cette paranoïa anti-malware, donc ça n’a pas l’air d’être un problème isolé
- Je pense qu’il faut garder à l’esprit que ce document est le prompt système pour le chat. Claude Code utilise probablement un prompt très différent, avec peut-être encore plus de formulations liées au refus des malwares. Les autres outils de codage superposeront eux aussi leurs propres prompts via l’API, et en plus, comme cette version ressemble à un nouveau modèle de base, il est tout à fait possible que les changements viennent du modèle lui-même
- À mon avis, il ne faut pas sous-estimer dès maintenant l’ampleur du problème malware. Tous les jours, on voit apparaître sur des sites comme playcode.io de fausses pages d’atterrissage imitant des shell scripts ou la page d’installation de Claude Code, et des gens dépensent beaucoup d’argent en Google Ads pour les afficher tout en haut. Le design est quasiment identique, donc il y a toujours un risque de cliquer sur la mauvaise page au moment d’installer. Google ne peut pas vérifier tous les shell scripts, donc c’est un vrai problème dans le monde réel
- J’ai l’impression que le marketing d’Anthropic vend de manière excessive l’idée que le modèle serait capable de créer des malwares ultra-sophistiqués. Du coup, je pense que cette communication anxiogène va imprégner toutes les mesures à venir. Il y a aussi un côté cynique à se dire qu’on joue la pièce du « hacker IA terrifiant », puis que dans un ou deux mois on passera, comme d’habitude, à un autre sujet
- J’ai commencé à ressentir cette paranoïa anti-malware dès la 4.6. Vu que Boris a lui aussi été surpris d’en entendre parler dans les commentaires, ça pourrait même être un bug
- Je suppose que la raison, c’est que le modèle est devenu trop bon pour écrire du logiciel. Si jamais il aidait quelqu’un à déployer un malware, et que ce malware utilisait en plus Claude lui-même pour se modifier et survivre, il deviendrait presque impossible de reprendre le contrôle ensuite
Je trouve que la consigne de ne pas essayer de prolonger la conversation quand l’utilisateur dit vouloir l’arrêter est une bonne idée. Les suggestions de suivi des chatbots ont très rarement été réellement utiles
Je savais que le prompt système grossissait, mais plus de 60 000 mots, ça m’a choqué. En tokens, ça doit faire autour de 80 000, donc même avec un contexte d’un million, on approche déjà des 10 %, alors que l’entrée utilisateur n’a même pas commencé. Et comme ça entre à chaque requête, ce n’est pas étonnant que les coûts d’infrastructure explosent. Il semble aussi y avoir beaucoup de contenu stable d’une version à l’autre ; je me demande donc pourquoi ils ne l’intègrent pas directement dans les poids pendant l’entraînement. Il y a peut-être un avantage en commodité de développement, mais du point de vue du déploiement, je ne vois pas en quoi ce serait meilleur ni pour la sécurité ni pour l’efficacité
- Le simple fait que ça fonctionne me surprend déjà. En janvier dernier, quand on construisait de l’automatisation IA dans une startup, il suffisait d’un prompt système de 1 000 mots pour que le modèle commence à rater une partie des règles. Même des consignes simples du genre « ne fais jamais X » étaient parfois ignorées
- Je ne pense pas que dire « tout est recalculé intégralement à chaque requête » soit exact. En général, on calcule une fois puis on met ça dans un K/V prefix cache pour le réutiliser comme état initial, et ensuite on traite surtout les nouvelles entrées. Bien sûr, du point de vue de l’attention, ces tokens restent tout de même en compétition avec le reste
- J’imagine que s’ils ne l’intègrent pas complètement dans les poids, c’est pour pouvoir faire des hotfixes après la sortie. Cela dit, je me demande quand même pourquoi autant d’éléments nécessitent en permanence des corrections a posteriori ; on a l’impression que c’est plus long que certains romans
- Je pense qu’il y a dans le document des sections markdown différentes selon le modèle, donc en pratique on est peut-être plutôt sur 3 000 à 4 000 mots
- Je me demandais si Claude Code ou le harnais au-dessus ajoutait son propre prompt système par-dessus celui d’Opus
J’ai l’impression que la 4.7 propose toujours trop d’options, même quand il existe clairement une meilleure réponse, au point de provoquer une fatigue décisionnelle presque moralisatrice
- Je pense que cette fatigue décisionnelle est peut-être un sous-produit appris du RLHF, et je trouve ça assez décevant
J’ai trouvé intéressant que les instructions ne soient pas formulées directement en « you should », mais à la troisième personne omnisciente, en disant « Claude should ». Il y a aussi beaucoup de « can » et de « should », ce qui donne moins l’impression d’ordres stricts que d’un ton passif et presque délibératif
- Je pense que « Claude » est un sujet plus explicite que « you ». Ça évite d’avoir à laisser l’attention inférer qui est l’agent concerné. Et puis, du côté d’Anthropic, ils semblent considérer que l’alignement basé sur des règles ne fonctionne pas très bien, et il a été dit que leur fameux soul document était rédigé « comme si on écrivait à un enfant comment se comporter dans le monde ». Le prompt système semble suivre une philosophie similaire
- Moi aussi, j’ai trouvé ça intéressant. Dans ce cas, on devrait peut-être nous aussi adopter un style similaire quand on rédige nos propres instructions, alors qu’en pratique la plupart des gens continuent à écrire « You », « There is ... », « Never do ... », etc. On dirait qu’Anthropic entraîne très profondément chez le modèle une identité de Claude ; du coup, je me demande ce qui se passe si on lui donne une autre identité, du genre « tu es Bob, plombier qui conseille sur la conception de systèmes d’alimentation en eau d’hôpital ». Est-ce qu’il continuera malgré tout à intérioriser comme règles les formulations concernant Claude ?
- Je comprends Anthropic comme voyant le modèle non pas comme un être doté d’une personnalité, mais comme une simulation de l’expérience d’une entité abstraite nommée Claude

Changements du prompt système entre Claude Opus 4.6 et 4.7

Changements du prompt système de Claude Opus 4.6 à 4.7

Changements de nom et de liste d’outils

Extension des consignes de sécurité pour les enfants

Fin de conversation et évolution du ton des réponses

Ajout de la section acting_vs_clarifying

Introduction de tool_search

Renforcement de la concision

Formulations présentes en 4.6 mais supprimées en 4.7

Nouvelles consignes sur les troubles alimentaires

Prévention des réponses brèves aux questions controversées

Suppression de la formulation de correction concernant Donald Trump

Les descriptions d’outils sont aussi un élément clé du suivi des changements

Résultat d’une interrogation directe de Claude

Liste des outils identifiés

Évolution par rapport à Opus 4.6

À lire aussi

1 commentaires

Commentaires Hacker News