page-agent - ajouter un agent IA à une page web avec une seule ligne de code
(alibaba.github.io)- Il suffit d’ajouter une seule ligne,
<script src="page-agent.js"></script>et le site web se transforme en application native pour l’IA- Fonctionne sans extension de navigateur, Python ni navigateur headless
- Donnez des instructions en langage naturel, l’IA s’occupe du reste. Grâce à la manipulation du DOM basée sur le texte, pas besoin de captures d’écran, d’OCR ni de LLM multimodal
- Avec un modèle d’exécution in-page où tout le traitement se fait à l’intérieur de la page web, il contrôle directement les éléments du DOM sans demander d’autorisations supplémentaires
- Compatible avec divers modèles comme OpenAI, Claude, DeepSeek et Qwen, avec aussi un mode entièrement hors ligne via Ollama (intégration par clé API)
- Fournit une UI interactive et une interface human-in-the-loop
- Testable sur n’importe quelle page web via un bookmarklet
- En installant l’extension Chrome, il prend aussi en charge les tâches reliant plusieurs pages, le contrôle au niveau du navigateur et même les intégrations externes
- Principaux cas d’usage
- SaaS AI Copilot : implémenter un AI Copilot dans le produit sans modifier le backend
- Automatisation intelligente des formulaires : raccourcir des processus de clics en plusieurs étapes en une seule phrase, pour améliorer les ERP/CRM/outils d’administration
- Amélioration de l’accessibilité : renforcer l’accessibilité web via les commandes vocales et les lecteurs d’écran
- Licence MIT : le dépôt est alibaba/page-agent
11 commentaires
Waouh, c’est fascinant..!!
Waouh, c'est impressionnant.
Cela semble pratique pour ajouter simplement un LLM à une page via un bookmarklet. Si le bookmarklet par défaut, qui passe par Alibaba (Chine), vous met mal à l’aise, vous pouvez renseigner
baseURLetapiKeypour le faire pointer vers l’endpoint LLM que vous utilisez. (comme un LLM local ou OpenAI, par exemple)javascript:(function(){import('https://cdn.jsdelivr.net/npm/page-agent@1.5.5/+esm').then(module=>{window.agent=new module.PageAgent({model:'gpt-5.4',baseURL:'<your-api-url>',apiKey:'<your-api-key>'});if(window.agent.panel)window.agent.panel.show();}).catch(e=>console.error(e));})();
Au début, je me suis dit : qu’est-ce que c’est, comment ça s’utilise ? Mais maintenant j’ai compris.
J’ai installé l’extension, puis sur Toss Securities, quand je lui ai dit que je voulais connaître le cours de SOXL il y a 30 jours, il est allé le chercher lui-même en manipulant l’interface, a vérifié le prix et me l’a indiqué.
C’est aussi bien plus rapide que de relier Playwright à une IA.
Ça fait le buzz sur les réseaux sociaux... il va falloir que j'essaie ça.
C’est énorme, on dirait qu’il y a tout de suite énormément de façons de l’utiliser.
J’ai l’impression qu’il suffira surtout d’améliorer l’aspect sécurité pour pouvoir s’en servir.
Oh, c’est vraiment sympa.
Et sur le site, il y a bien ce genre de chose, et quand je le fais glisser pour de vrai, ça s’ajoute aux favoris.
C’est la première fois que je vois ça, c’est vraiment fascinant. C’est une très bonne méthode pour partager un bookmarklet.
Ah.. le bookmarklet de GeekNews existait aussi depuis les débuts de l’ouverture.
https://news.hada.io/bookmarklet
Oh, je ne savais pas qu’il y avait aussi ce super bookmarklet sur GeekNews haha
Ça a l’air facile à utiliser même pour le grand public, et je trouve ça vraiment excellent
C’est intéressant. On dirait qu’Alibaba a encore sorti quelque chose d’original.
Ça pourrait valoir le coup de l’intégrer aux outils d’administration internes d’un service ?
En gros, on crée juste le CRUD, puis on lui demande de faire ceci et cela dans un certain ordre, et ça a l’air de construire un workflow.
La démo est intrigante.
Sans même l’intégrer directement dans le code, en utilisant un bookmarklet,
on peut l’appliquer à n’importe quel site web.