Développé par Microsoft Research, Fara-7B est un petit agent IA de 7 milliards de paramètres capable d’exécuter directement des tâches informatiques comme la navigation web, le remplissage de formulaires ou les réservations. Sur le benchmark WebVoyager, il a atteint un taux de réussite de 73,5 %, dépassant GPT-4o (65,1 %) et UI-TARS (66,4 %). Ce modèle s’exécute sur le PC de l’utilisateur sans passer par le cloud, ce qui protège la confidentialité des données, et adopte une approche de « souveraineté des pixels » qui lui permet de gérer les clics de souris, la saisie au clavier et le défilement uniquement à partir de captures d’écran, avec une bonne efficacité (16 étapes en moyenne pour terminer une tâche).
Son fonctionnement repose sur un apprentissage à partir de données générées et compressées via 145 000 trajectoires de tâches synthétiques par le système Magentic-One, et il s’exécute rapidement sur le NPU des Copilot+ PC. Côté sécurité, il demande l’approbation de l’utilisateur aux « Critical Point », et Magentic-UI permet de suivre ses actions et d’intervenir. Il est publié sous licence MIT sur Hugging Face et Microsoft Foundry.
Il a également montré de bonnes performances sur d’autres benchmarks (Online-Mind2Web 34,1 %, DeepShop 26,2 %, etc.), mais ses limites incluent une baisse de précision sur les tâches complexes ainsi que des problèmes d’hallucination. Microsoft le considère comme une « preuve de concept » et prévoit d’élargir l’écosystème développeur grâce à l’open source.
Conclusion : Fara-7B montre le potentiel des petits modèles et constitue un exemple important de l’émergence d’une ère des assistants IA personnels moins dépendants du cloud. À l’avenir, des progrès plus sûrs et plus intelligents sont attendus grâce à l’apprentissage par renforcement.
1 commentaires
Les petits modèles sont trop sensibles au prompt, donc difficiles à utiliser facilement... La seule réponse, c’est de faire des tests répétés ?