9 points par GN⁺ 2025-07-14 | 2 commentaires | Partager sur WhatsApp
  • BrowserOS est une alternative open source, centrée sur la confidentialité, à Perplexity Comet : un navigateur agentique qui exécute des agents IA en local
  • Basé sur un fork de Chromium, il prend en charge toutes les extensions Chrome existantes, avec la particularité que les données utilisateur sont stockées uniquement en local
  • Il peut s’intégrer à divers fournisseurs d’IA comme OpenAI, Anthropic, Ollama, et permet d’utiliser une clé API personnelle ou des modèles locaux
  • Il intègre des outils de productivité modernes comme un surligneur natif, un système de favoris basé sur ChatGPT et une recherche sémantique, avec en plus un blocage publicitaire basé sur l’IA prévu prochainement
  • Contrairement aux navigateurs traditionnels, les données ne sont pas transmises à des entreprises de recherche ou de publicité, et l’IA exécute en local des workflows automatisés

Présentation de BrowserOS

  • BrowserOS est un navigateur agentique open source qui fournit un environnement dans lequel des agents IA fonctionnent directement sur l’ordinateur de l’utilisateur
  • Fondé sur une philosophie privacy-first, il utilise des clés API ou des modèles locaux comme Ollama afin d’éviter toute fuite de données vers l’extérieur
  • Comme il repose sur un fork de Chromium, il offre la même interface utilisateur que Chrome et prend en charge toutes les extensions Chrome

Fonctionnalités principales

  • Agents IA et exécution locale

    • Dans le navigateur, les agents IA s’exécutent directement en local, pour gérer les tâches répétitives et les workflows d’automatisation
    • Grâce à l’intégration d’Ollama, il est possible d’exécuter de grands modèles de langage sur sa propre machine plutôt que dans le cloud, avec garantie de confidentialité des données
  • Outils de productivité

    • Prise en charge d’outils de productivité intégrés au navigateur comme le surligneur et les favoris ChatGPT
    • La recherche sémantique permet de retrouver rapidement des données du navigateur comme l’historique ou les favoris
  • Blocage publicitaire et boutique MCP (à venir)

    • Blocage publicitaire basé sur l’IA (bientôt disponible), présenté comme une alternative après le blocage de uBlock Origin dans Chrome
    • La boutique MCP (Multi Command Package) (bientôt disponible) permettra d’installer en un clic des MCP populaires et de les utiliser directement depuis la barre du navigateur
  • Open source et centré sur la communauté

    • Sous licence AGPL-3.0, 100 % open source, avec transparence garantie sur le code et le fonctionnement
    • La participation et les contributions de la communauté sont activement encouragées

Cas d’usage représentatifs

  • Automatisation des tâches répétitives et fastidieuses : prise de rendez-vous, remplissage de formulaires, tâches répétées gérées automatiquement par l’IA
  • Deep research : exploration du web pour générer des rapports de synthèse, avec une collecte d’informations efficace sans gestion manuelle des onglets
  • Analyse de contenu sur les réseaux sociaux : tri automatique et organisation de publications pertinentes sur LinkedIn, Twitter, etc.

Comparaison avec d’autres navigateurs

  • Chrome : peu de changements majeurs depuis 10 ans, absence de fonctions IA / automatisation / MCP
  • Brave : stratégie dispersée autour de la crypto, de la recherche et du VPN, sans focalisation sur le navigateur IA
  • Arc/Dia : solutions fermées, non open source, sans alternative en cas d’abandon
  • Perplexity Comet : centré sur les entreprises de recherche et de publicité, avec transmission des données utilisateur vers les serveurs, alors que BrowserOS conserve toutes les données uniquement en local

Installation et démarrage

  • Téléchargement disponible pour macOS et Windows
  • Import des données Chrome (optionnel)
  • Connexion à un fournisseur d’IA (OpenAI, Anthropic, Ollama, etc.)
  • Démarrage immédiat de l’automatisation par agent

Licence

  • Licence open source AGPL-3.0

2 commentaires

 
luiseok 2025-07-14

https://fr.news.hada.io/topic?id=21581
Ça me paraissait familier, et après vérification, c’était simplement Nxtscape renommé.

 
GN⁺ 2025-07-14
Avis Hacker News
  • L’exemple d’achat de dentifrice montré dans la démo illustre à quel point ces tâches sont difficiles : le terme même de dentifrice est très ambigu, donc au final l’agent choisit au hasard dans une liste énorme. Pour certaines tâches, les actions précédentes peuvent servir de guide, mais ce n’est souvent pas le cas. Par exemple, si le dentifrice acheté précédemment est en rupture de stock, on ne sait pas quoi faire. Du coup, je me demande si ce genre d’exemple fait vraiment gagner du temps ; de toute façon, il faut vérifier le résultat, donc on travaille en double. Je pense que c’est pour cette raison que des systèmes comme Alexa n’ont pas pu offrir l’expérience d’achat qu’Amazon espérait au départ. Il vaudrait sans doute mieux montrer un exemple plus complexe où le gain de temps est évident et où les cas d’échec sont réduits au minimum, ou au contraire se concentrer sur la manière de récupérer après un échec. Est-ce qu’on fournit une UI adaptée à un problème précis, ou est-ce qu’on résout tout par le chat ? Je pense que tout cet univers est loin d’être simple. Bonne chance à tous.
    • C’est vrai, tout le domaine des agentic browsers en est encore à ses débuts. Nous aussi, nous ne faisons que commencer et nous cherchons encore des use cases de niche qui ont une vraie valeur. Il existe des tâches répétitives et ennuyeuses où le gain de temps est évident, par exemple les vendeurs tiers de Walmart qui vérifient plusieurs fois par jour les prix des concurrents pour ajuster les prix de leurs produits. Ça, un agentic browser peut l’automatiser facilement.
    • Je pense aussi qu’il faudrait pouvoir exécuter les tâches selon les préférences esthétiques propres à chaque utilisateur, mais j’ai l’impression que ça pourrait devenir un cauchemar en matière de sécurité.
  • J’avais déjà installé Nxtscape, et comme je ne savais pas que le nom du produit avait changé, j’ai lancé BrowserOS et j’ai été déconcerté de voir exactement la même UI et la même fenêtre de chat avec le même emoji renard. Honnêtement, l’ancien nom était meilleur. Je suppose que le changement vient de raisons juridiques.<br>J’ai essayé de lui demander de résumer les commentaires d’un article d’Arstechnica, mais au début je n’ai reçu qu’une réponse disant qu’il ne pouvait pas résumer parce que les commentaires n’étaient pas inclus. Il a fallu lui indiquer explicitement de cliquer sur le lien « comments » pour qu’il commence enfin à lire les commentaires. À titre indicatif, il y avait 3 pages de commentaires au total ; pendant plus de 20 minutes, il a effectué environ 100 actions, dont beaucoup de défilements très précis de 1074 pixels, et j’attends toujours le résumé avec le statut « Validating task completion... »<br>Sur le plan fonctionnel, ça a l’air puissant, mais ça demande trop de manipulation et c’est trop lent pour être réellement utilisable.<br>À titre de comparaison, comme Nxtscape était aussi installé, j’ai fait la même expérience et il a terminé la tâche plus vite et avec moins d’actions. Je ne sais pas si c’était un hasard ou si cela vient d’une logique interne différente.<br>Et il existe une extension Chrome qui permet d’utiliser les mots de passe iCloud dans Chrome, mais elle ne fonctionne ni dans Nxtscape ni dans BrowserOS. Si je dois continuer à ouvrir moi-même le gestionnaire de mots de passe, je n’utiliserai pas ce genre de navigateur, et je n’ai pas non plus l’intention de changer de gestionnaire de mots de passe.
    • Nous avons changé le nom pour éviter des problèmes, et l’ancien nom était aussi difficile à prononcer. Merci pour le retour ; ce serait super d’en discuter davantage sur Discord (https://discord.gg/YKwjt5vuKr) ! Notre équipe déploie tous les jours et améliore le produit à un rythme très rapide, et l’agent devrait être bien meilleur dans quelques jours. Nous allons aussi vérifier le sujet de l’extension de mots de passe iCloud ; notre objectif est de rendre l’onboarding et la gestion des mots de passe beaucoup plus simples.
  • Si c’est un navigateur privacy first, je me demande pourquoi vous n’avez pas utilisé Firefox. Firefox correspond beaucoup mieux à cet objectif et c’est une meilleure option par défaut. Tor Browser, Mullvad Browser, LibreWolf et les autres navigateurs axés sécurité/vie privée sont tous basés sur le moteur de Firefox.<br>Et je pense qu’il nous faut absolument des moteurs de navigateur web variés. Si on finit par n’utiliser que les moteurs des grandes entreprises tech, ce sera une énorme perte pour les consommateurs et cela freinera l’innovation.<br>Il faut davantage soutenir les navigateurs indépendants comme Firefox.
    • Ça a été une décision vraiment difficile. Nous avons parlé avec des gens qui ont construit des navigateurs sur WebKit, et ils nous ont dit qu’il leur avait fallu presque deux ans rien que pour corriger des bugs aléatoires et résoudre les problèmes de compatibilité avec les sites. Le moteur Firefox/Gecko est peut-être meilleur que WebKit, mais la conclusion reste que si l’on utilise un moteur autre que Chromium, cela demande énormément de travail supplémentaire, ne serait-ce que pour la compatibilité des sites web et la prise en charge des extensions. Nous ne sommes qu’une startup de deux personnes, et la codebase de Chromium était un point de départ bien plus simple à compiler, donc nous l’avons choisie. Et puis il y a aussi le fait qu’on peut tout à fait construire un navigateur centré sur la vie privée au-dessus de Chromium, comme Brave. Surtout à l’ère des agentic browsers, il y a énormément de choses à améliorer immédiatement en matière de confidentialité — par exemple, envoyer des données sensibles à Perplexity Comet pour en tirer des revenus publicitaires, c’est vraiment mauvais. Il est bien plus important de prendre en charge les LLM locaux ou de permettre aux utilisateurs d’utiliser leur propre clé API.
    • Je me posais exactement la même question. Je me demande pourquoi utiliser Chromium tout en se présentant comme orienté vie privée.
  • J’ai lu ceci : « nous patchons directement le code source C++ de Chrome, ce qui nous donne la même sécurité que Google Chrome » Dans ce cas, je me demande si vous refaites votre propre build à chaque mise à jour de Chromium, parce qu’il arrive souvent que des patchs avec des messages de commit apparemment anodins concernent en réalité des vulnérabilités graves, qui ne sont révélées en CVE que 90 jours plus tard.
    • Bonne question ; jusqu’à présent, nous continuons à build à partir des versions de Chromium sur lesquelles s’appuie Google Chrome.
  • Je préférerais que ce soit proposé sous la forme d’une extension de navigateur plutôt que comme un navigateur indépendant.
    • Au départ, nous voulions nous aussi en faire une extension de navigateur.<br>Mais nous pensons que pour construire un bon agent copilot, plusieurs modifications sont indispensables au niveau du C++ de Chromium. Par exemple, Chromium possède l’arbre d’accessibilité de tous les sites web, mais on ne peut pas y accéder via l’API des extensions Chrome. Un accès direct à cet arbre améliore énormément les performances de l’agent.<br>Nous ajoutons aussi au niveau C++ diverses capacités permettant à l’agent d’interagir avec les sites web, comme les actions de clic ou l’indexation des éléments. Faire cela en JS est 20 à 40 fois plus lent.
    • Nous pensons exactement la même chose. Pour implémenter des fonctions agentiques, il n’est pas nécessaire d’avoir un navigateur complet ; dans les limites de permissions existantes, une extension de navigateur suffit largement. Google déploie souvent directement des correctifs zero-day, et il existe clairement des fonctionnalités que Google n’intègre pas à Chromium. C’est pourquoi je ne peux pas faire confiance à un fork open source aléatoire comme navigateur principal. Je recommande l’extension de navigateur AI Web Agent rtrvr.ai (https://rtrvr.ai), qui s’intègre déjà au workflow des utilisateurs.
    • J’ai eu exactement la même pensée quand nanobrowser a été mentionné ici.
    • https://github.com/nanobrowser/nanobrowser mérite d’être essayé.
  • C’est un projet similaire à nanobrowser, qui est une extension Chrome : https://github.com/nanobrowser/nanobrowser
    • En parcourant rapidement la page du projet, on dirait qu’il utilise une clé d’API LLM externe. Le projet présenté dans le post initial semble, lui, utiliser transformer.js pour faire tourner le LLM en local.
    • Si ce type de fonctionnalité peut déjà être implémenté sous forme d’extension, je me demande pourquoi il faudrait aller jusqu’à forker un logiciel existant pour la construire. Je serais curieux de connaître les différences précises entre nanobrowser et BrowserOS, notamment ce que BrowserOS permet de faire et que nanobrowser ne permet pas.
    • Merci de l’avoir mentionné.
  • Il est écrit : « <i>Nous fabriquons aussi un bloqueur de pub basé sur un LLM depuis que Chrome a bloqué uBlock Origin</i> », mais puisqu’il s’agit de toute façon d’un fork de Chromium, je me demande s’il ne suffirait pas de réutiliser uBlock Origin.
    • Chromium prévoit de supprimer l’API Manifest V2, et aucun fork ne semble vouloir la conserver durablement. Même Brave développe son propre bloqueur de pub intégré.<br>La vraie question est plutôt : pourquoi choisir Chromium plutôt que de forker Firefox, alors que Firefox fournit déjà tout cela ?
  • Je suis curieux de connaître la feuille de route pour Linux ; je n’ai ni Mac ni Windows.
    • Nous en sommes conscients, et cela devrait être pris en charge au début de la semaine prochaine.<br>Nous restons une équipe de deux personnes, donc il y a vraiment énormément de choses à faire.
  • J’aimerais voir l’IA déplacer directement le curseur de la souris, cliquer, et afficher aussi les frappes au clavier en temps réel à l’écran, avec des interactions qui donnent l’impression qu’un humain utilise réellement l’ordinateur, un peu comme dans un tutoriel logiciel. Quand l’IA change de page et fait bouger l’UI très vite comme maintenant, l’affichage paraît saccadé et il est difficile de suivre le fil. Il n’y a pas assez d’indices sur ce qu’il faut regarder, donc on a juste l’impression de regarder un enregistrement d’écran. Cela dit, je pense qu’il pourrait y avoir des cas d’usage intéressants dans des domaines comme mcp/browser automation, donc je suis curieux de voir comment cela va évoluer.
    • C’est un retour vraiment utile, merci !<br>Nous allons voir si nous pouvons aussi ajouter le mouvement du curseur. Les frappes au clavier s’affichent déjà comme si elles étaient faites par une vraie personne, mais nous pouvons probablement les rendre un peu plus lentes pour qu’elles soient plus faciles à suivre.
    • Je pense que ce qu’on veut vraiment, c’est caretaker ai.
  • Félicitations !<br>Je me demande comment vous comptez rendre ce projet durable d’un point de vue financier, développement et maintenance.
    • Merci !<br>En gros, nous comptons suivre le même modèle que les projets open source en vendant des licences pour une version Enterprise du navigateur.
    • Je suppose qu’au fond ce n’est qu’une app Electron ou un wrapper Chromium avec un wrapper Ollama par-dessus (il existe déjà plein de bibliothèques open source gratuites permettant de contrôler un navigateur).