6 points par GN⁺ 2025-10-22 | 1 commentaires | Partager sur WhatsApp
  • ChatGPT Atlas est un nouveau navigateur web basé sur l’IA intégré autour de ChatGPT, visant à évoluer vers un « super-assistant » en réunissant le contexte utilisateur, les outils et les tâches.
  • Atlas accompagne l’utilisateur dans sa navigation sur le web et permet à ChatGPT de l’aider à effectuer des actions sans quitter la page, tout en conservant la compréhension du contexte.
  • Grâce à la mémoire du navigateur, les informations des sites visités sont mémorisées pour répondre aux questions, faire des résumés ou aider à la planification d’un agenda.
  • En Mode Agent, ChatGPT peut effectuer de réelles actions dans l’environnement de navigation de l’utilisateur, notamment ouvrir des onglets, rechercher des informations, réserver ou commander.
  • ChatGPT Atlas est disponible dans le monde entier sur macOS, tandis que les versions Windows, iOS et Android sont prévues ensuite, et est présenté comme une nouvelle étape de la navigation basée sur l’IA

  • ChatGPT Atlas est un outil navigateur web basé sur l’IA qui combine ChatGPT et un navigateur web
    • Il vise à devenir un environnement de navigateur intelligent qui comprend le contexte utilisateur, au-delà de la simple recherche.
  • Après la diffusion rapide de la fonction de recherche web de ChatGPT, OpenAI a repensé le navigateur avec une approche centrée sur l’IA afin de prendre en charge l’automatisation des tâches, la recherche et la planification d’agenda.
  • L’utilisateur peut obtenir directement l’aide de ChatGPT dans la fenêtre Atlas, sans copie ni collage manuel.

Fonctionnalité de mémoire du navigateur

  • Atlas stocke une mémoire du navigateur basée sur les informations des sites visités afin de proposer une conversation contextuelle et une assistance personnalisée.
    • Exemple : une demande comme « résume les offres d’emploi que j’ai vues la semaine dernière » est traitée automatiquement.
  • La mémoire est gérée sous contrôle total de l’utilisateur, qui peut à tout moment consulter, archiver ou supprimer son contenu.
  • La suppression de l’historique de navigation supprime également la mémoire associée, et il est possible d’ajuster l’étendue du souvenir par site.
  • Le contenu de navigation n’est par défaut pas utilisé pour l’entraînement du modèle ; il n’est inclus que si l’utilisateur active explicitement l’opt-in.

Mode Agent (Agent Mode)

  • Le Mode Agent intégré à Atlas est une fonction permettant à ChatGPT d’effectuer de vraies actions dans le navigateur de l’utilisateur.
    • Exemples : mettre des ingrédients dans un panier puis les commander à partir d’une recette, ou lire un document et réaliser une analyse concurrentielle.
  • L’agent ouvre des onglets avec l’autorisation de l’utilisateur, clique et poursuit ensuite le travail.
  • Il est proposé en version préliminaire aux utilisateurs Plus, Pro et Business, avec une amélioration continue pour gagner en vitesse et en fiabilité.

Sécurité et confidentialité

  • Atlas repose sur une conception priorisant la sécurité, avec les limites suivantes :
    • Exécution de code dans le navigateur, téléchargement de fichiers, installation d’extensions : toutes ces actions sont impossibles dans Atlas.
    • Pas d’accès aux fichiers locaux ni aux autres applications.
    • Les sites sensibles, comme les institutions financières, sont mis en pause automatiquement.
    • L’agent reste accessible même en mode déconnexion, ce qui réduit au minimum les risques d’exposition de données personnelles.
  • Pour empêcher des attaques via des commandes cachées sur des pages ou des e-mails malveillants, OpenAI a réalisé des milliers d’heures de tests en red team, et dispose d’un dispositif de correctifs rapides pour répondre aux nouveaux types d’attaque.
  • Les utilisateurs sont invités à limiter les risques d’exposition d’informations en surveillant les actions et en utilisant le mode déconnexion.

Paramètres de données et de contrôle

  • L’utilisateur peut contrôler la visibilité des sites auxquelles ChatGPT peut accéder grâce à un interrupteur dans la barre d’adresse.
    • Quand il est désactivé, l’accès au contenu de la page est bloqué et la création de mémoire est interrompue.
  • Si vous souhaitez que les données servent à l’entraînement, l’option « include web browsing » permet d’inclure le contenu web.
  • Les contrôles parentaux ont également été renforcés, et les parents peuvent désactiver la mémoire du navigateur ou le Mode Agent.

Plateformes prises en charge et déploiement

  • ChatGPT Atlas est lancé dès maintenant sur macOS, pour les utilisateurs Free, Plus, Pro et Go.
  • Les utilisateurs Business, Enterprise et Edu peuvent y accéder si un administrateur l’active.
  • Les versions Windows, iOS et Android seront disponibles très prochainement.
  • Les utilisateurs peuvent importer leurs marque-pages, mots de passe et historique depuis leur navigateur actuel pour une transition fluide.

Perspectives

  • OpenAI prévoit pour les prochaines étapes de ChatGPT Atlas la prise en charge de profils multiples, l’amélioration des outils pour développeurs et l’extension de l’intégration Apps SDK.
  • Les exploitants de sites peuvent améliorer le fonctionnement du ChatGPT Agent sur leur site en ajoutant des balises ARIA.
  • Ce lancement est considéré comme la première étape d’une expérience où l’IA entre dans le navigateur pour concrétiser une expérience web interactive

1 commentaires

 
GN⁺ 2025-10-22
Avis de Hacker News
  • À mon avis, se concentrer uniquement sur la confidentialité est trop limité ; l'essentiel est de savoir si cette technologie peut véritablement transformer en profondeur la navigation Internet existante et quel impact elle peut avoir sur la monétisation du trafic web. Notamment, la différence entre une expérience vraiment nouvelle en V0.1 et une V1.0 est énorme : si c'est déjà du niveau V1.0, la transition hors d’un web classique peut avancer très vite et avoir un impact économique important. Dans ce cas, les investissements IA dans les datacenters sont clairement justifiables.

  • Voici un récapitulatif des écrans principaux de l’installateur DMG de ChatGPT Atlas (capture d'écran d'installation) :

    1. Mémoire du navigateur : mémorisation d’informations utiles pendant la navigation pour obtenir des réponses et des suggestions plus intelligentes, avec une gestion directe par l’utilisateur de la confidentialité de la mémoire.
    2. Poser des questions à ChatGPT depuis n’importe quel site : ouvrir la barre latérale ChatGPT pour résumer le contenu d’un site, expliquer, ou traiter diverses tâches.
    3. Utiliser le curseur comme outil de collaboration : obtenir de l’aide d’un clic sur le logo ChatGPT pour rédiger des emails, réviser, remplir des formulaires, etc.
    4. En le définissant comme navigateur par défaut : déblocage sur 7 jours des limitations de message, téléversement de fichiers, analyse de données, génération d’images, etc.
    5. Un message de bienvenue accompagné d’un badge dit que tout est prêt pour explorer le web avec Atlas en gérant ses données et sa confidentialité de manière sécurisée. Beaucoup d’utilisateurs de ChatGPT Free le mettront probablement en navigateur par défaut, ne serait-ce que pour la fonction (4) ; l’idée est vraiment astucieuse.
    • J’ai entièrement désactivé la mémoire ChatGPT, parce que les frontières d’identification sont mal gérées ; par exemple, en demandant à propos des pneus d’hiver, il m’a répondu avec une remarque bizarre du type « vous travaillez dans le firmware, donc vous êtes probablement plus sensible à la durabilité ».

    • La fonction la plus attendue est la recherche en langage naturel dans l’historique du navigateur. Il m’arrive souvent d’avoir oublié le titre d’un lien vieux de 5 mois, mais de pouvoir décrire son contenu ; j’ai perdu parfois plus de 10 minutes à le retrouver.

    • J’ai essayé de le passer en navigateur par défaut à cause de la fonction (4), mais ce qui m’a paru le plus suspect, c’était la demande d’accès au trousseau de clés, que j’ai refusée.

    • Je n’ai pas vu d’avantage de laisser Atlas en navigateur par défaut, d’habitude ; avec ce type de bonus, beaucoup vont probablement conserver ce réglage.

    • Je me demande comment faire confiance à une entreprise qui dit « vous contrôlez votre confidentialité ». C’est une entreprise qui a déjà fait des balayages massifs sur le web, donc avec une histoire de violations de la confidentialité, ça n’aide pas.

  • La réponse d’OpenAI me semble similaire à Comet de Perplexity, et je me demande si ce n’est pas ce qui va devenir la norme. En pratique, ce type de navigateur IA apporte de la valeur, mais on a l’impression qu’un Big Tech unique va finir par tout contrôler. J’espère qu’un navigateur open source (Firefox, etc.) proposera enfin des fonctions similaires avec ses propres LLM. Idéalement, en local plutôt qu’en cloud, mais le problème, c’est qu’une grande majorité des bons ML engineers est déjà partie chez les Big Tech.

    • Je voudrais demander où se situe la valeur. Je ne l’ai pas utilisé personnellement, mais au vu des revues YouTube ça a l’air très instable et pas tellement utile, ce qui me rappelle l’époque du lancement de Siri : au final, je n’ai pas eu l’impression d’en faire grand-chose, si ce n’est régler un minuteur, contrôler la musique, etc.

    • Il est clair que la fonction d’agent IA est une tendance, et j’ai le sentiment que Gemini sera vite intégré à Chrome. Si un mode agent propre apparaît, il pourrait engloutir le marché du navigateur.

    • Les gens semblent inquiets de voir apparaître une version IA d’un navigateur existant, comme Chrome, et ce n’est pas une peur irrationnelle. Mais je reste sceptique sur sa réussite grand public : même si l’écosystème des navigateurs a besoin de changement, on reste avec ce qui existe jusqu’à une contrainte forte, sinon on ne change pas. Ce changement pourrait quand même arriver.

    • Personnellement, je préfère clairement un plugin navigateur sandboxé qu’une gestion globale de tout le navigateur ; malgré ça, Comet m’a plu.

    • « Mon idée d’un seul Big Tech qui sait tout et gère tout » me laisse un malaise total. Je ne veux absolument pas remettre davantage ma vie/mes données à des entreprises qui en ont déjà trop entre les mains. Je n’ai encore jamais vu d’exemple où l’IA améliore réellement ma vie ; je vais plutôt utiliser Lynx. L’IA rend le web – des résultats de recherche au contenu des pages – déjà inutilement bruité, donc pour moi c’est au final une contrainte.

  • J’ai testé le mode agent d’Atlas : il m’a trouvé, parmi les commentaires HN, des messages auxquels je pouvais ajouter un éclairage supplémentaire. Résultat : 7 commentaires dans des sujets startup/cloud que je connais bien, et 3 sur des sujets moins familiers (fine-tuning LLM). Les recommandations allaient globalement dans le sens de ce que je dirais, mais la manière de formuler me semblait éloignée. Après ce test, je me suis dit qu’en l’utilisant, des activités qui étaient intéressantes pour moi allaient peut-être devenir des tâches sans âme. L’outil est intéressant, mais je ne sais pas encore à quoi l’utiliser.

  • Je me demande pourquoi Atlas n’est disponible que sur macOS ; avec Linux ou Windows, l’impression aurait été davantage celle d’un lancement global.

    • L’application de bureau ChatGPT est restée, pour presque 4 mois, quasi exclusivement macOS ; comme elle est basée sur Electron, il semble qu’ils n’aient pas vraiment soigné Windows. Aucune version Linux officielle n’a été publiée, et pour Atlas, après le lancement mondial macOS, ils n’ont dit que : « Windows, iOS, Android arriveront bientôt » ; il ne faut probablement pas attendre une version Linux.
  • Je vois clairement qu’il y a une utilité, mais j’ai l’impression que cela revient à confier toute la granularité de ma vie à une entreprise IA. Quand j’ai une question, ouvrir simplement l’app ChatGPT me paraît souvent mieux. À mes yeux, ça ressemble à l’extension Honey, avec en plus un problème de perte de données bien plus grave : j’ai du mal à croire que mes données restent vraiment privées ne serait-ce qu’une seconde.

    • Il y avait déjà eu un débat sur la télémétrie des navigateurs ; là, c’est comme si l’historique complet d’usage web était diffusé en continu à une entreprise IA. Au bout du compte, la fin pourrait être le chargement de toutes les données de la vie dans leur cloud : emails, contacts, messages, historique de navigation, GPS, caméra AR de Meta, scan 3D de la maison, relevés bancaires, etc. On ne sait pas quand on acceptera ce coût de la commodité comme si de rien n’était.
  • Atlas est clairement basé sur Chromium mais je ne vois nulle part mention de Chromium, crédit ou licence, et les pages chrome:// sont toutes bloquées. Si c’est un projet open source, il me semble qu’il faut au minimum indiquer la source et la base de manière transparente ; au début il peut y avoir des lacunes, mais ce principe devrait être une base. Est-ce la norme, ou suis-je le seul à ressentir ça comme étrange ?

    • Si on va dans Help > ChatGPT Atlas Help, il existe une doc officielle et la phrase "Atlas est un navigateur macOS basé sur Chromium d’OpenAI" y figure. C’est probablement l’information officielle.

    • Selon les obligations de licence, la licence BSD de Chromium exige d’indiquer clairement l’origine des œuvres dérivées ; le contenu du fichier NOTICE doit être affiché quelque part dans l’œuvre, donc son omission dans Atlas est surprenante. Chromium BSD License

    • J’ai demandé directement à Atlas et on m’a indirectement indiqué qu’il existe atlas://credits, mais il n’y a ni chemin d’accès officiel ni emplacement d’exposition.

    • Une entreprise déjà connue pour le plagiat semble maintenant ne plus reconnaître l’open source non plus ; je trouve ça cohérent.

    • Sans se compliquer, on a l’impression qu’on a essayé d’effacer les traces Chromium/Google : nulle part elles ne sont mentionnées, toutes les pages chrome:// sont bloquées, et l’UI a effacé toute apparence open source. Cette opacité est encore plus gênante au regard de l’obligation légale de mention des sources.

  • OpenAI semble prendre le relais sur ce qu’Apple Intelligence ne parvient pas à traiter. Idéalement, ce serait mieux intégré aux fonctionnalités de base macOS : utiliser FoundationLLM pour maximiser le calcul/secret local, et n’appeler leurs propres serveurs que pour les appels de gros modèles frontier quand c’est nécessaire. Je pense qu’il faut absolument que macOS fasse évoluer son intégration d’assistant IA au niveau de l’OS. Apple Intelligence a un bon point de départ, mais la puissance des modèles locaux manque, et les fonctions vraiment importantes semblent se cacher dans la stack.

    • Toutes ces tentatives d’intégration me paraissent bancales : Siri est mauvaise, ChatGPT est surtout « appelable », et Apple Intelligence n’est pas mieux utilisable. On a l’impression qu’Apple se demande si Siri doit être retirée, ou si elle doit intégrer ChatGPT plus en profondeur, ou même abandonner la recherche par défaut de Google malgré la manne… Atlas devenant un vrai concurrent de Safari est aussi intéressant, et on voit OpenAI développer de plus en plus en priorité des cas comme sora2 ou Atlas pour Apple.
  • Je n’utilise pas de plugin Chrome basé sur LLM pour une raison de confiance : la crainte de collecte excessive de mes données navigateur. Ici c’est la même inquiétude, avec en plus le poids d’une grande marque. Je ne sais pas si c’est vraiment mieux.

    • Si des acteurs comme Private Internet Access ou NordVPN sortaient leur propre extension IA de navigateur (ou un navigateur en propre), ce serait une vraie valeur : anonymiser le trafic et faire tourner plusieurs modèles LLM pourrait attirer beaucoup d’utilisateurs d’OpenAI et de Perplexity grâce à l’image privacy.

    • Il y a eu un précédent où, dans l’app ChatGPT macOS, OpenAI a rendu la surveillance des données plus difficile via le certificate pinning.

    • Je pense qu’il y a une confusion sur le fait qu’un plugin LLM puisse accéder à plus d’infos que d’autres plugins ; on dirait qu’ils ont mal compris la structure manifest de Chrome.

    • Je pense qu’un LLM peut être puissant dans un bon contexte, mais je reste plus confortable avec une certaine distance ; je préfère l’utiliser quand j’en ai besoin, directement. Je ne veux pas que l’IA me suive en permanence et m’observe.

  • Si cette technologie paraît utile, il faut imaginer à quel point les régimes autoritaires la convoiteront. Si un message publicitaire a déjà donné la chair de poule, Atlas ressemble à un service de keylogger au niveau root : je ne vois pas pourquoi on devrait autoriser une entreprise IA à collecter/enregistrer toutes mes interactions navigateur. Google fait déjà ça avec Chrome ; l’objectif d’optimiser la pub et celui de capter le mode de pensée humain pour entraîner des modèles IA généralistes sont vraiment des choses différentes.

    • En regardant rapidement la page produit, je ne vois pas exactement sur quelle base on pourrait affirmer qu’Atlas collecte/enregistre plus d’informations que l’association Chrome+Gemini. La plupart des fonctions sont déjà intégrées, et si l’enregistrement de chaque frappe au clavier était la norme, Google le pourrait aussi. En réalité, les deux semblent poursuivre le même objectif de modèle prédictif utilisateur ; je ne ressens pas une différence très nette entre Chrome et Atlas.

    • Il y a un aspect proche de Microsoft Recall, mais la différence ici est que l’utilisateur active la fonction lui-même. C’est une opportunité claire de publicité ciblée pour OpenAI.

    • Les modèles de données pour la pub ciblée (démographie/paiement/localisation/revenu) et la captation du mode de pensée d’un utilisateur pour entraîner une IA généraliste ne sont pas du tout les mêmes. Si Atlas réussit, Google le fera aussi ; Gemini existe déjà dans Chrome, l’intégrer à Chrome sera vite fait, et avec des TPU dédiés, on aurait en fait quelque chose d’équivalent à Atlas.

    • Mon navigateur s’exécute-t-il en root ? Atlas s’exécute-t-il en root ? Atlas enregistre-t-il chaque frappe au clavier comme un keylogger ? J’aimerais bien savoir si ces points sont avérés.