2 points par dybala21 2026-03-27 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Je construis rune, un assistant IA généraliste qui fonctionne en local.

L’idée centrale n’est pas un « agent qui accumule de la mémoire », mais une architecture auto-améliorante qui généralise les échecs en règles et ajuste elle-même son comportement en validant ces règles sur des tâches réelles.

Auto-amélioration : créer des règles à partir des échecs, puis les revérifier

Exécution → journalisation → détection des répétitions d’échec → génération de candidats de règles → validation sur les tâches concernées → promotion ou suppression

Quand l’agent répète le même type d’échec, il transforme ce motif en candidat de règle préventive. Cette règle n’est pas injectée immédiatement dans le prompt. Elle commence avec un faible niveau de confiance, puis seuls les résultats des tâches pertinentes sont suivis par la suite.
Seules les règles utiles sont progressivement promues, tandis que les règles inefficaces perdent plus vite des points et disparaissent.

Toutes les tâches sont enregistrées sous forme d’episode, avec leur résultat de succès ou d’échec. Lorsqu’une tâche similaire se présente, l’agent ressort les episode passés pour s’y référer.

Proactif : agir avant même qu’on le demande

Il propose de l’aide avant même qu’un utilisateur ne la demande. Lorsqu’il détecte des signaux de frustration dans le flux de travail (échecs répétés, annulations rapides, accumulation d’erreurs), il propose son aide, et si un motif d’échec récurrent est détecté, il génère automatiquement une règle préventive.

Cela dit, il n’interrompt pas sans discernement. Si l’utilisateur refuse les suggestions, ce retour est suivi. En cas de 5 refus en moins de 30 minutes, il réduit automatiquement la fréquence de ses interventions et relève le seuil de suggestion. Le système proactif lui-même s’ajuste en observant les réactions de l’utilisateur.

Ce que l’agent peut faire

  • lire/écrire/modifier/rechercher des fichiers, exécuter des commandes shell
  • automatisation du navigateur — navigation entre pages, clics, saisie, captures d’écran, extraction de texte
  • recherche web (DuckDuckGo/Brave) et scraping d’URL
  • analyse de code — suivi de symboles basé sur tree-sitter, recherche de définitions/références, analyse d’impact des modifications
  • délégation à des sous-agents — découper des tâches complexes pour les exécuter en parallèle
  • exécution planifiée basée sur cron
  • intégration de serveurs MCP — découverte et exécution automatiques d’outils externes
  • compétences personnalisées — l’utilisateur peut créer et enregistrer lui-même des outils

Sécurité

Guardian bloque d’abord les actions dangereuses, Completion/Evidence Gate vérifie si le système a « réellement lu, écrit et validé », et Quality Gate filtre les réponses de succès vides de contenu ou les erreurs dissimulées. Le système de sécurité n’est pas fail-open mais fail-closed.

Local-first

Toute la mémoire à long terme repose sur des fichiers Markdown comme source of truth. SQLite et FAISS ne sont que des caches de recherche, et peuvent être reconstruits à tout moment à partir des fichiers Markdown. Il est possible de les ouvrir directement, de les modifier et d’en gérer les versions avec git.

Interface

  • terminal UI basée sur CLI + Rich
  • multicanal : Telegram, Discord, Slack, LINE, WhatsApp, Google Chat, Mattermost
  • Web

La stack technique repose sur Python 3.13+, litellm, APSW(WAL), FAISS HNSW, tree-sitter et structlog. Via litellm, il est possible de se connecter à n’importe quel LLM sans être lié à un fournisseur de modèles spécifique.

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.