Un système de trading actions 100 % autonome qui relie 31 LLM dans un dispositif de validation croisée

(t.me)

19 points par cjb9452 2026-03-28 | 8 commentaires | Partager sur WhatsApp

Bonjour. Je suis un étudiant développeur : ce qui a commencé comme un toy project pour gérer mon portefeuille personnel a progressivement pris de l’ampleur, au point de me conduire à bâtir un système de 31 agents LLM.

Au départ, je l’avais conçu comme un service web B2C de recommandation de titres pour attirer des utilisateurs. Mais je me suis heurté au problème du coût massif des communications API, ainsi qu’à la difficulté de valider son utilité. J’ai donc abandonné l’acquisition d’utilisateurs (le marketing), supprimé toute l’UI/UX, puis pivoté vers un pipeline où mon compte-titres réel (10 millions de wons) est directement connecté et où l’IA prend seule toutes les décisions et exécute les ordres. C’est ce système que j’exploite aujourd’hui.

Je souhaite partager avec la communauté GeekNews l’architecture que j’ai conçue au fil de mes réflexions, ainsi que les essais-erreurs techniques rencontrés en chemin.

🧠 Architecture du système : 6 étapes, validation croisée entre 31 agents

Ce système (K-Agent Alpha) ne repose pas sur un simple prompt, mais fonctionne comme un pipeline relais multi-agents qui reproduit une approche d’investissement top-down complète. Son exécution se fait de manière séquentielle pendant environ une heure.

Analyse du portefeuille & psychologie de marché (Phase 0~1) :
- Il récupère le solde réel via l’API KIS (Korea Investment & Securities) et analyse le taux de réussite des transactions passées pour alimenter une boucle de feedback.
- Il définit la posture de marché à partir de cinq indicateurs, dont la volatilité (VIX), le taux de change et la variation du KOSPI.
Équipe macroéconomie (Phase 2 - 7 agents) :
- Des agents dédiés aux taux, au change et aux produits dérivés analysent la liquidité mondiale via FRED, l’API de la Banque de Corée, etc.
- Pour éviter une réflexion unidirectionnelle, le système est conçu pour forcer la production de trois scénarios : Base / Bull / Bear.
Équipe industrie/secteurs (Phase 3 - 10 agents) :
- C’est le pipeline le plus sophistiqué du système. Il filtre les secteurs prometteurs à partir des flux en temps réel des investisseurs étrangers et institutionnels, du PER sectoriel et de l’actualité issue des recherches.
- Pour corriger les hallucinations propres aux LLM (recommander des actions inexistantes), j’ai placé un agent Validator chargé de filtrer mécaniquement les titres radiés de la cote ou sous le seuil de capitalisation boursière.
Équipe analyse d’entreprise & risque (Phase 4 - 8 agents) :
- Elle passe au crible les états financiers DART, les graphiques (indicateurs techniques) et les actualités pour faire remonter des candidats. Le risk manager vérifie la pression vendeuse à découvert et le MDD.
Décideur final, le CIO (Phase 5 - 1 agent) :
- Les productions des 30 agents (Gemini Flash) sont consolidées par le modèle phare gemini-3.1-pro-preview, considéré comme le plus performant.
- Pour éviter le biais des coûts irrécupérables (Sunk Cost Fallacy), j’ai appliqué un prompt de « Bounded Autonomy » qui impose systématiquement de préciser « le scénario Bear Case si je me trompe » et les « conditions d’invalidation de l’investissement ». Le JSON généré à cette étape est ensuite envoyé à mon API Korea Investment & Securities.

💡 Dépannage : biais cognitifs des LLM et explosion du trafic

En exploitant le système, j’ai rencontré puis résolu deux problèmes particulièrement douloureux.

Les LLM ne savent pas couper leurs pertes (effet de disposition) :
- L’IA reproduisait exactement les biais cognitifs humains : elle voulait vendre trop vite les titres gagnants dès qu’ils montaient un peu, et laissait traîner les positions perdantes en se disant qu’« un jour elles remonteront ». Pour corriger cela, j’ai modifié la logique afin que, si la décision d’aujourd’hui contredit celle d’hier, le système doive expliciter pourquoi sa posture a changé, puis évaluer lui-même son propre taux de réussite passé pour se contredire via une démarche de red-teaming.
Limites de trafic API des 31 agents (Rate Limit & Context Limits) :
- En analysant en profondeur 20 à 30 titres, je me heurtais en permanence à des explosions de tokens ou à des blocages dus aux limites des API externes. J’ai finalement refondu l’architecture en traitement batch, de sorte que les gros volumes de données — états financiers, indicateurs graphiques, etc. — soient agrégés côté backend en une seule fois via get_fundamental_batch_all, ce qui a permis de stabiliser le temps d’exécution à moins d’une heure.

📊 Exemple de logs réellement produits par l’IA

Une fois ce processus terminé, l’IA produit un rapport stratégique (log) d’un niveau de profondeur assez élevé, comme ci-dessous.

(Extrait d’un vrai log de diagnostic macroéconomique rédigé hier par l’IA)
« Alors que l’ampleur du rebond du PPI (prix à la production, 2,43 %) dépasse celle du CPI (2,0 %), la compression des marges des entreprises devient une réalité...
Le marché des futures enregistre un état de backwardation profonde à -1112.61.
Avec un pétrole au-dessus de 100 dollars et un taux de change au-delà de 1 520 wons, l’entrée dans une phase de “Sudden Stop” se matérialise.
→ Relèvement marqué de la part de cash jusqu’à environ 34 %. Intégration d’équipementiers de construction navale, dont l’attrait en valorisation ressort de manière transversale. »

💻 Résultats d’exécution et observation des logs

Comme l’ensemble du code source est encore fortement mêlé à mes clés de sécurité et à la logique de mon compte réel, je ne peux pas encore le publier en open source de manière à ce que vous puissiez simplement faire un git clone et l’exécuter immédiatement (je prévois plus tard de nettoyer les prompts clés et le pipeline pour les mettre sur GitHub).

En revanche, j’ai relié un canal Telegram dédié afin que vous puissiez voir comment ce pipeline de 31 prompts discute réellement pendant une heure chaque jour et évaluer les logs de décision (résultats) qu’il produit.

Il ne s’agit ni d’une landing page, ni de collecte d’e-mails, ni d’une initiative marketing.
Des rapports d’investissement de niveau institutionnel, générés automatiquement à 100 % par des LLM sans intervention humaine, ainsi que l’historique des transactions en temps réel qui en résulte (compte réel connecté), sont diffusés en streaming chaque jour à 15 h 05.

👉 Canal des logs de décision IA (rapports) en temps réel : t.me/K_Agent_Alpha

Si vous vous intéressez aux systèmes multi-agents ou au prompt engineering, je vous serais vraiment reconnaissant si vous pouviez jeter un œil et me faire des retours techniques francs, ou des conseils sur l’architecture et la correction des erreurs de jugement de l’IA !

8 commentaires

github88 2026-03-29

Aïe...

dydwls140 2026-03-30

Aïe...

woonsa 2026-03-30

Les LLM ont un temps de raisonnement, donc ils réagissent trop lentement pour le trading en temps réel ou le HFT. Ils ne sont utilisables qu’au minimum sur des bougies de 5 minutes. De plus, même en combinant plusieurs modèles LLM, on n’obtient pas forcément de meilleures performances. Il vaudrait mieux confier à environ 5 LLM l’analyse de la logique, ainsi que l’analyse émotionnelle du marché ou des communautés — par exemple déterminer s’il s’agit d’euphorie ou de peur — que les modèles logiques ou LSTM ne parviennent pas à capter, puis les intégrer en ensemble avec des modèles de deep learning comme advanced PPO, CNN, LSTM (analyse des données historiques des graphiques), ainsi qu’avec une méthode de trading fondée sur la propre logique d’analyse de l’utilisateur. Pour le trading ultra-court terme, des modèles de deep learning comme LSTM et CNN sont plus adaptés.

cjb9452 2026-03-30

Nous en tenons suffisamment compte. C’est pourquoi nous essayons d’éviter le trading à haute fréquence en misant sur le cours de clôture en fin de séance.

woonsa 2026-03-31

Pour vous donner un petit conseil supplémentaire : l’idée, c’est de spécialiser de petits modèles LLM sur un domaine précis via un fine-tuning SFT (NTR), puis de les faire tourner en local, et de n’utiliser qu’un seul grand modèle de langage via API. Si vous spécialisez des modèles de l’ordre de 7B ou 3B pour certaines analyses, vous pouvez obtenir de meilleurs résultats. Ah, et pour le SFT (NTR), si vous exploitez activement AI Hub, c’est pratique pour constituer un dataset. (J’ai déjà essayé de construire quelque chose de similaire moi aussi ^^;)

woonsa 2026-03-30

Ah, et un ou deux mois de backtesting sont absolument nécessaires. Sinon, vous pourriez voir le LLM faire n’importe quoi et faire fondre vos actifs. (acheter au plus bas, vendre au plus haut)

galaxy11111 2026-03-30

Vous avez créé un assemblage d’hallucinations extrêmement sophistiqué... Le marché est imprévisible. Si ce que vous avez construit permet de plus que doubler votre patrimoine, j’admettrai que j’avais tort.