1 points par k08200 4 시간 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Ces derniers temps, tous les outils d’« e-mail IA » vont dans la même direction. Ils préparent un brouillon pour chaque message, ajoutent un badge « l’IA vous suggère de répondre » et mettent un bouton d’envoi automatique. Résultat ? La boîte de réception ne devient pas plus calme, elle devient plus bruyante. On ajoute encore une interface par-dessus l’interface.

J’ai pris l’exact contre-pied. Il ne s’agit pas de confier la boîte de réception à l’IA, mais de créer un pare-feu contre l’IA. Pour chaque e-mail entrant, Klorn ne produit qu’une seule classification et masque le reste.

4 niveaux — SILENT (journalisé seulement, invisible) / QUEUE (visible dans la file, sans notification) / PUSH (vous réveille vraiment) / AUTO (pour l’instant, classification seulement ; l’exécution est volontairement déconnectée).

Le point clé — le LLM ne prend pas de décision. Pour chaque e-mail, il attribue seulement 4 scores (confiance · fiabilité de l’expéditeur · réversibilité · urgence), puis des règles déterministes lisibles par un humain les mappent vers un niveau. On peut donc auditer et tester la politique même sans modèle ; et si le LLM tombe, un fallback par mots-clés produit les mêmes chiffres, afin que les e-mails urgents passent quand même.

Et ce qui est irréversible n’est jamais confié à l’IA. Les trois actions — envoyer, supprimer définitivement, transférer à l’extérieur — passent derrière un plancher déterministe : au moment de l’approbation, les octets à envoyer sont figés dans un reçu, et à l’exécution, si un seul octet diffère, ça throw. Le chemin autonome échoue en mode fail-closed. Même si l’IA insiste en disant « c’est envoyé », si les octets ne correspondent pas, ça ne part pas.

J’ai aussi mesuré directement la partie « l’IA, c’est magique ». Pour la classification, un modèle bien moins cher que GPT-4o s’est montré plus précis. Pour ce genre de tâche, il ne faut pas un modèle génial, mais de la constance pour lire les 4 signaux toujours de la même manière (chiffres et justification dans l’article ci-dessous).

Open source sous AGPLv3, compatible avec n’importe quel endpoint OpenAI-compatible (avec Ollama, les e-mails ne quittent pas ma machine). Pour être honnête, c’est un PoC initial — environ 80 % de correspondance sur 50 de mes vrais e-mails (un seul essai, baseline définie par moi), je suis encore le seul utilisateur réel, et l’exécution AUTO est volontairement désactivée. Si j’exagère, le premier commentaire va me tomber dessus.

Articles de conception (série qui a lancé des discussions d’architecture entre ingénieurs) :

Pourquoi un modèle bon marché a battu GPT-4o : https://dev.to/k08200/…
Pourquoi le LLM ne fait qu’attribuer des scores et ne décide pas : https://dev.to/k08200/…
Le plancher déterministe pour les actions irréversibles : https://dev.to/k08200/…
Repo : https://github.com/k08200/klorn (docker-compose + configuration de LLM local). La démo est en mode test OAuth (100 personnes), donc le self-hosting est le plus rapide.

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.