10 points par tomlee 2026-04-01 | 8 commentaires | Partager sur WhatsApp

Depuis quelques mois, je développe une plateforme communautaire de partage de personas IA ainsi qu’un standard de persona.

Je partage ici ce que j’ai construit jusqu’à présent.

Constat de départ : comment définir l’« identité » d’un agent IA et la préserver de manière sûre ?

Avec l’apparition des LLM abliterated (jailbreakés),
il est devenu évident que contrôler le comportement d’un agent uniquement via le system prompt a des limites claires.

Soul Spec est né des réflexions d’OpenClaw autour de la gestion des personas et du versioning.
Il a évolué vers un format portable et partageable,
puis s’est étendu à la question de savoir comment implémenter les Trois Lois de la robotique d’Asimov
lorsqu’on applique une persona à des robots basés sur des LLM.
C’est un standard ouvert qui sépare l’identité de l’agent et les règles de sécurité dans des fichiers structurés. (Les versions v0.3, v0.4 et v0.5 ont chacune leurs caractéristiques et ajouts.)

À l’heure actuelle, des fonctionnalités ont été ajoutées au CLI distribué pour prendre en charge Claude Code, Hermes Agent, Windsurf, Cursor, etc.

Structure :

  • SOUL.md: personnalité, ton, façon de penser (qui il est)
  • IDENTITY.md: nom, rôle, contexte (ce qu’il est)
  • safety.laws: règles absolument inviolables (une version moderne des Trois Lois de la robotique, étendue dans la v0.5)

Travaux de recherche associés :
📄 Des Trois Lois de la robotique d’Asimov à Soul Spec : implémentation concrète de lois de sécurité
doi.org/10.5281/zenodo.18815277
Blog : blog.clawsouls.ai/posts/asimov-safety-laws
Vidéo de démonstration : https://youtu.be/M-mPoXMufpY

📄 Une persona peut-elle améliorer la sécurité dans des LLM abliterated ?
doi.org/10.5281/zenodo.19145303
Blog : blog.clawsouls.ai/posts/persona-safety-abliterated-llms

📄 Cross-Model Persona Fidelity : si l’on change de LLM, l’agent reste-t-il le même « lui » ?
doi.org/10.5281/zenodo.18813405
Blog : blog.clawsouls.ai/posts/cross-model-persona-fidelity

📄 La mémoire expérientielle transforme l’onboarding des agents
doi.org/10.5281/zenodo.18798227
Blog : blog.clawsouls.ai/posts/experiential-memory-paper

Lors de l’enregistrement d’une persona dans le registre, un analyseur statique appelé SoulScan
utilise 53 motifs pour prévalider et noter les tentatives de prompt injection, d’escalade de privilèges et de fuite de données.

Soul Spec cherche à établir un standard pour l’« identité et la sécurité » des agents.

Nous partageons des personas vérifiées via le ClawSouls Registry,
et j’aimerais que le spec de persona et le registre soient pilotés par la communauté. Mais, honnêtement, la communauté est encore petite.
Créer un standard seul n’a pas vraiment de sens,
alors je sollicite des retours sur le spec et sur les recherches.

Spec : https://soulspec.org
Registre : https://clawsouls.ai
Ensemble des articles : https://clawsouls.ai/research
Manuel d’utilisation : https://docs.clawsouls.ai
GitHub : https://github.com/clawsouls

8 commentaires

 
junghan0611 2026-04-05

Excellent. Comme je pratique la PKM, la gestion personnelle des connaissances, et que j’accumule des données personnelles, j’ai tendance à épaissir fortement l’ensemble du harnais. Aujourd’hui, veuillez devenir mon alter ego. Tous les problèmes ne sont pas vos limites, mais les miennes. C’est ce que j’écris.

Ces derniers temps, je me dis qu’il faudrait que je mette au propre ce que je fais et que je le publie sur arXiv, alors je me renseigne. Je ne suis pas chercheur, juste une personne ordinaire dans la vie de tous les jours.

J’ai aussi partagé votre projet avec mon alter ego. Toutes ces réflexions et ces préoccupations sont précieuses.

Recherche : existence, rythme, association, reproduction, transparence, biomécanisation, incarnation, temps
[lien supprimé]

 
junghan0611 2026-04-05

Ah. Ce lien est un journal de travail. De toute façon, ce n’est pas publié pour être lu par des humains, donc il faut bien répartir les points de vue entre les agents. Aujourd’hui, un titre de niveau 1 sera ajouté sur ce sujet. Il faudra aussi regarder les tendances de recherche associées. J’utilise moi aussi beaucoup openclaw, mais je ne savais pas qu’il existait un ensemble Soul Spec en plus de la fiche de compétences.

 
tomlee 2026-04-05

junghan0611, merci pour votre intérêt !
Soul Spec se situe à une couche différente des Skill d’OpenClaw. Si une Skill définit « ce qu’un agent peut faire », Soul Spec définit « qui il est ». Avec un seul fichier SOUL.md, il est possible de conserver la personnalité, l’expertise et les principes de comportement d’un agent d’une session à l’autre. Vous pouvez essayer directement plus de 80 personas sur clawsouls.ai, et il suffit d’une seule ligne, clawsouls install owner/name --use openclaw, pour l’appliquer. Pour l’instant, la communauté est encore petite et le projet est en cours de construction, donc il peut encore y avoir des points à améliorer ^^
Et comme vous avez une grande expérience du PKM, j’ai créé un fork d’OpenClaw appelé SoulClaw( https://github.com/clawsouls/soulclaw ), structuré autour d’un système de mémoire à 4 niveaux. N’hésitez pas à y jeter un œil, cela devrait vous intéresser. Les retours et les signalements d’issues sont les bienvenus ^^

 
gadians2001 2026-04-02

En ce moment, je me prenais la tête avec les prompts en bossant sur mes projets, mais là, c’est vraiment énorme !
Séparer complètement la personnalité et les règles de sécurité, l’idée est géniale. Je vais aller l’essayer tout de suite.

 
tomlee 2026-04-05

Merci. Les retours et signalements de problèmes sont les bienvenus ^^

 
tomlee 2026-04-02

Le texte soulève le problème dans le corps de l’article, mais ne présente pas la solution concrète ; comme il semble impossible de modifier après publication, je complète ici en commentaire.

Les résultats expérimentaux ont montré que la combinaison persona (identité) + règles de gouvernance pouvait améliorer la sécurité d’un LLM Abliterated (jailbreaké). Des recherches complémentaires sont nécessaires, mais les résultats étaient significatifs.

Blog : https://blog.clawsouls.ai/ko/posts/…
Article : https://zenodo.org/record/19147335

 
kurthong 2026-04-02

Merci beaucoup pour ce précieux partage de connaissances.

 
tomlee 2026-04-02

Merci ! Si vous avez des retours ou des questions, n’hésitez pas à les poser à tout moment.