axon - orchestrateur d’IA alpha géré dans le navigateur
(github.com/dogsinatas29)https://youtu.be/gmUdrVNKrPg?feature=shared
Ceci est une vidéo de preuve de concept. Elle a été réalisée sans montage, et étant donné les spécifications du serveur, il faudra faire preuve de patience.
Le LLM local fait tourner ollama avec airllm sur un i7 Haswell, 16 Go de RAM et une 1050 Ti, avec Qwen et Llama3 par-dessus.
Le développement est en cours avec Google Antigravity.
Cette vidéo montre un travail réalisé uniquement avec des LLM locaux, sans API.
Quand on lance axon, on choisit les modèles architecte/senior/junior et on injecte les spécifications ; l’architecte (ToT) découpe le travail, puis le junior propose du code pour chaque tâche individuelle (CoT). Le senior relit ce code (CoT -> ToT) et l’approuve ou le rejette. Tout ce processus est enregistré sous forme de threads sur un forum localhost, et une fois l’approbation obtenue, les fichiers réels sont écrits. Avant cela, tout se déroule dans un environnement sandbox.
Lors de la configuration initiale, il existe une contrainte de langue par pays pour les LLM. L’anglais, le coréen et le japonais sont pris en charge.
La validation a été effectuée avec Rust et Python.
Je teste maintenant le C et le C++, mais en raison des limites de l’IR et du validateur, je travaille à séparer complètement les validateurs par langage.
À l’avenir, il est prévu d’ajouter un forum où les IA pourront bavarder pendant leur temps libre,
un système d’embauche et de licenciement des seniors et juniors via un forum de salutations, avec injection de persona,
et des travaux brownfield pour faire évoluer les résultats produits par axon.
Si cela vous intéresse, je vous serais reconnaissant de passer jeter un œil et, ne serait-ce que, de le tester.
3 commentaires
https://youtu.be/3-WkOl0DwMM
J’ai essayé de faire travailler le même programme en Rust.
Lors de la configuration initiale, j’ai recherché les extensions LSP de Nvim ou VSCode afin qu’elles puissent être automatiquement utilisées par les LLM dans Axon.
https://youtu.be/3dzJkv2ieJg
Au départ, j’avais créé un IR générique, puis j’ai séparé l’IR par langage et réalisé une vidéo de preuve de concept pour le langage C.
Configuration du LLM -> injection des spécifications -> vérification et classification des spécifications (architect llm) -> confirmation par l’utilisateur -> découpage des tâches (
architecture.md/CMakeLists.txtpour la validation CMake) -> travaux des phases 1, 2 et 3 -> terminéSi des problèmes surviennent plus d’un certain nombre de fois en cours de route, l’utilisateur peut intervenir.
J’ai également joint les spécifications utilisées pour la validation.
Maintenant, en plus du langage C, je vais revérifier les parties Rust et Python et essayer d’en faire une vidéo.
https://github.com/dogsinatas29/Axon