- Automatise le navigateur en convertissant des commandes en langage naturel en interactions navigateur (code Selenium)
- Vise à automatiser, à la place de l’utilisateur, des tâches simples, répétitives, chronophages et nécessitant très peu d’effort cognitif
- Conçu pour faciliter l’automatisation des workflows web et leur exécution dans le navigateur en fournissant un moteur qui convertit des requêtes en langage naturel en code Selenium
Fonctionnalités principales
- Traitement du langage naturel : comprend des instructions en langage naturel pour effectuer des interactions dans le navigateur
- Intégration Selenium : s’intègre de manière fluide à Selenium pour automatiser les navigateurs web
- Open source : construit sur des projets open source comme transformers et llama-index, et utilise des modèles open source garantissant la transparence afin de rester aligné avec les intérêts des utilisateurs
- Prise en charge de modèles locaux pour la confidentialité et le contrôle : prend en charge des modèles locaux comme
Gemma-7b afin que les utilisateurs gardent un contrôle total sur leur assistant IA et garantissent la confidentialité
- Techniques d’IA avancées : utilise des embeddings locaux (
bge-small-en-v1.5) pour effectuer du RAG et extraire les portions de HTML les plus pertinentes, puis exploite le Few-shot learning et le Chain of Thought afin de dériver le code Selenium le plus pertinent pour exécuter la tâche, sans avoir besoin de fine-tuner le LLM (Nous-Hermes-2-Mixtral-8x7B-DPO) pour la génération de code
Pour commencer
- Vous pouvez essayer LaVague dans un notebook Colab.
Feuille de route
- Il s’agit d’un projet naissant, mais il peut évoluer vers une démocratisation de modèles d’IA transparents et alignés capables d’agir sur Internet pour les utilisateurs.
- Les principaux axes d’exploration sont le fine-tuning de modèles locaux pour en faire des experts du Text2Action, l’amélioration de la recherche afin de n’utiliser que les portions de code pertinentes pour la génération de code, ainsi que la prise en charge d’autres moteurs de navigateur (par ex. playwright) ou d’autres frameworks d’automatisation.
L’avis de GN⁺
- LaVague a le potentiel d’automatiser les tâches répétitives des utilisateurs, de faire gagner du temps et d’améliorer la productivité. Cela peut être particulièrement utile pour des tâches comme la saisie répétée de données ou le remplissage de formulaires.
- Développé sur une base open source, il offre à la fois aux utilisateurs et aux développeurs transparence et possibilité de modification. Cela peut favoriser l’innovation portée par la communauté et contribuer à instaurer la confiance des utilisateurs.
- La technologie d’automatisation abordée par LaVague s’intègre à des outils déjà familiers à de nombreuses entreprises et à de nombreux développeurs, comme Selenium, ce qui facilite son intégration dans les workflows existants.
- L’automatisation fondée sur l’IA exige un haut niveau de précision et d’efficacité. Les techniques proposées par LaVague, comme le Few-shot learning et le Chain of Thought, peuvent aider à minimiser les erreurs susceptibles de survenir lors du traitement de tâches complexes.
- L’adoption de ces technologies nécessite de prendre en compte la confidentialité des utilisateurs et la sécurité des données. La prise en charge de modèles locaux peut constituer une manière de répondre à ces préoccupations, mais les utilisateurs doivent malgré tout surveiller attentivement la façon dont leurs données sont traitées.
2 commentaires
Ça a l’air vraiment bien de pouvoir le tester dans un environnement notebook. Heureusement que l’intégration de Playwright est dans la feuille de route,,
Avis Hacker News
Avis sur l’essai de nouveaux outils
Expérience du vidage de Google Photos
Avis sur les outils d’automatisation du navigateur comme TaxyAI
Expérience avec les tests Selenium
Inquiétude sur l’ignorance des consignes d’automatisation sur les sites web
Avis sur l’impact potentiel de l’automatisation
Intérêt pour la compatibilité avec les modèles
Impact sur le vote en ligne
Importance des benchmarks montrant le taux de réussite
Intérêt pour le projet