Atlas a été dévoilé Dans la nuit du 22 octobre, OpenAI a lancé ChatGPT « Atlas », un nouveau navigateur web.
Atlas est un navigateur web basé sur l'IA construit sur ChatGPT, et OpenAI a indiqué avoir préparé ce projet pendant très longtemps. OpenAI pense que l'IA est une opportunité qui ne se présente peut-être qu'une fois tous les dix ans, et qu'elle permet de reconsidérer ce qu'un navigateur peut faire, la manière dont on utilise un navigateur, et la manière la plus productive et agréable d'utiliser le web. L'ancien modèle des onglets était bon, mais OpenAI a estimé que l'innovation navigateur n'avait pas beaucoup progressé depuis, ce qui les a poussés à repenser son potentiel.
Par le passé, la barre d'adresse et la barre de recherche étaient les éléments centraux de l'utilisation d'Internet, mais OpenAI affirme qu'à l'avenir ce sera un navigateur centré sur l'expérience de chat qui jouera un rôle clé. C'est pourquoi OpenAI a commencé à concevoir le navigateur autour de cette expérience utilisateur. Une grande partie du travail et de la vie quotidienne se déroule déjà dans les navigateurs, et si ChatGPT devient l'outil d'aide principal, on pourra faire bien plus : chatter avec des pages, utiliser ChatGPT pour chercher des informations et utiliser le mode agent de ChatGPT dans le navigateur. OpenAI prévoit de montrer davantage de fonctionnalités pour que les utilisateurs puissent les tester eux-mêmes.
Les fonctionnalités clés d'Atlas Atlas est parti de la question : « Et si l'on pouvait discuter avec le navigateur ? ».
À partir de cette idée, OpenAI dit avoir repensé l'expérience de chat en simplifiant des années de fonctionnalités complexes. Atlas n'est pas un navigateur classique avec seulement un bouton de chat ajouté ; il est conçu avec ChatGPT au centre, et ChatGPT accompagne l'utilisateur tout au long de la navigation du web. Avec Atlas, les utilisateurs poseront plus de questions et apprendront davantage.
Atlas a été conçu pour être rapide et flexible, afin de prendre en charge des expériences nouvelles et surprenantes.
Atlas s'appuie sur les fonctions principales suivantes : le chat partout sur le web, la mémoire navigateur et la fonction agent de ChatGPT. C'est un nouveau type de navigateur pour une nouvelle ère du web, et OpenAI a de grands espoirs dans le potentiel qu'il démontre.
- Fonctionnalité de chat
- Mémoire navigateur
- Fonctionnalité agent
Fonctionnalités principales d'Atlas Lorsque vous téléchargez Atlas pour la première fois, ou lorsque vous ouvrez un nouvel onglet, un écran d'accueil s'affiche.
Cet écran est conçu pour rappeler les navigateurs traditionnels, mais intègre toutes les fonctionnalités de ChatGPT. Au centre de l'écran se trouve un espace de composition où vous pouvez poser vos questions, ainsi qu'une barre latérale avec les outils, les modèles et l'historique de chat. Le fait qu'il s'agisse d'un navigateur permet d'aller plus loin : vous pouvez, par exemple, entrer une URL pour accéder à un site précis ou utiliser un favori pour ouvrir une page spécifique. Vous pouvez également utiliser la mémoire du navigateur pour retrouver des pages déjà consultées sans connaître leur emplacement exact.
La page d'accueil d'Atlas comprend une fonction de recommandation. Ces recommandations sont générées en fonction des activités de l'utilisateur et peuvent suggérer des articles d'actualité ou des tâches d'agent susceptibles de l'intéresser. Plus vous utilisez Atlas, plus les recommandations deviennent précises. Dans l'exemple GitHub, il est possible, en travaillant sur du code, d'inviter ChatGPT dans la barre latérale pour comprendre et éditer le contenu d'une page web, transformant ainsi un simple outil d'affichage d'informations en un outil capable de les comprendre et de les modifier.
Ouverture d'onglet La page Nouvelle étape est le point de départ d'Atlas. En posant une question ou en entrant une URL, vous voyez des résultats plus rapides et plus utiles au même endroit. En dehors du chat, pour explorer des résultats plus précis, vous pouvez sélectionner dans l'onglet des liens de recherche, des images, des vidéos et des actualités (si disponibles).
Poser une question à ChatGPT Cliquez sur « Demander à ChatGPT » pour ouvrir la barre latérale ChatGPT et gérer directement un résumé, une explication ou une tâche dans la fenêtre. Comme ChatGPT peut consulter les détails de la page où vous vous trouvez, les réponses sont plus utiles et toujours bien contextualisées.
Utiliser le curseur ChatGPT aide à fournir l'édition en ligne et des suggestions d'écriture sur tous les écrans de texte libre.
Suggestions personnalisées ChatGPT se souvient de ce que vous avez exploré et peut suggérer quoi faire ensuite : retourner à une page précédente, approfondir un sujet, proposer des idées connexes ou automatiser des tâches quotidiennes.
Demander Si vous avez besoin de quelque chose, demandez à tout moment. Si vous tapez « Rouvrir les chaussures vues hier » ou « Ranger les onglets », le reste est pris en charge par ChatGPT.
Autres
Quand la mémoire navigateur est activée, ChatGPT se souvient des informations clés des contenus recherchés, ce qui améliore les réponses de chat et permet de faire des suggestions plus intelligentes, par exemple en créant des tâches récentes ou en poursuivant la recherche d'un cadeau de fin d'année à partir de produits consultés. La mémoire navigateur est stockée en mode privé sous le contrôle du compte ChatGPT et de l'utilisateur.
Depuis les paramètres, vous pouvez consulter toutes les mémoires, conserver celles qui restent pertinentes, puis supprimer l'historique de navigation. Même si la mémoire navigateur est activée, vous pouvez utiliser le bascule de la barre d'adresse pour décider sur quels sites ChatGPT peut voir et sur lesquels il ne peut pas. Si la visibilité est désactivée, ChatGPT ne peut pas voir le contenu de la page et aucune mémoire n'est créée pour ce site.
Par défaut, le contenu exploré n'est pas utilisé pour entraîner le modèle. Si vous le souhaitez, vous pouvez activer dans les paramètres de contrôle des données « include web browsing » ; si l'entraînement des conversations est activé sur votre compte ChatGPT, vous pouvez également l'activer pour Atlas. Cela inclut le contenu des sites web joint via la barre latérale Demander à ChatGPT et la mémoire navigateur, qui alimente les informations du chat.
La fonction de protection parentale peut également fonctionner dans Atlas. Si les parents ont configuré la protection parentale pour ChatGPT, ces paramètres sont relayés dans les conversations ChatGPT d'Atlas, et OpenAI prévoit d'introduire de nouveaux contrôles parentaux dans Atlas, dont une option permettant aux parents de désactiver la mémoire navigateur et le mode agent.
Nous avons donné la priorité à la sécurité en construisant la fonctionnalité agent de ChatGPT dans Atlas et ajouté des mécanismes de sécurité pour traiter les nouveaux risques liés à l'accès aux sites connectés et à la recherche dans l'historique.
Le navigateur ne peut pas exécuter de code, télécharger des fichiers ou installer des extensions. Il ne peut pas accéder aux autres applications de l'ordinateur ou au reste du système de fichiers. Pour certains sites sensibles, comme les institutions financières, l'activité peut être suspendue pour vérifier qu'aucune action n'est entreprise. En mode déconnecté, l'agent peut être utilisé pour limiter l'accès aux données sensibles et réduire le risque qu'il agisse comme un utilisateur sur un site web.
La fonction agent de ChatGPT comporte toujours des risques. Outre les erreurs que l'agent peut commettre lorsqu'il agit à la place d'un utilisateur, elle est également vulnérable à des instructions malveillantes cachées, qui peuvent être dissimulées sur des pages web ou des e-mails avec l'intention d'ignorer le comportement attendu de l'agent ChatGPT. Cela peut conduire au vol de données sur des sites connectés ou à des actions non intentionnelles.
Comme indiqué dans la system card de l'agent ChatGPT, nous avons mené des heures intensives de red teaming, en mettant notamment l'accent sur la mise en place de mécanismes de sécurité pour résister à ces attaques, notamment pour que ChatGPT puisse s'adapter rapidement à de nouvelles menaces. Cependant, il est impossible d'empêcher toutes les attaques qui accompagneront la montée en popularité des agents IA ; les utilisateurs doivent donc évaluer le compromis lorsqu'ils décident quelles informations confier à un agent, utiliser le mode déconnexion de ChatGPT dans Atlas ou surveiller l'activité de l'agent pour réduire au minimum leur exposition à ces risques. Nous continuerons à surveiller en permanence les vulnérabilités détectées et à les corriger.
Ce lancement est une première étape vers un futur où la plupart de l'utilisation du web se fera via un système d'agents. Vous pourrez ainsi déléguer les routines et vous concentrer sur l'essentiel.
Recherche et chat Cursor Le mode agent d'Atlas est une fonctionnalité avancée qui permet à Atlas d'explorer le web et d'effectuer des tâches pour l'utilisateur.
Cette fonction peut réaliser des tâches que l'utilisateur préfère ne pas faire lui-même ou l'aider à apprendre à utiliser un nouveau logiciel. OpenAI dit être surpris par la puissance que cet agent peut atteindre lorsqu'il a un accès complet au navigateur et à votre internet personnel. Le mode agent place la sécurité au premier plan et intègre des garde-fous dans toute la stack, du modèle à l'expérience produit.
Grâce au mode agent, ChatGPT peut contrôler le navigateur de l'utilisateur et effectuer des tâches.
Par exemple, il peut vérifier la liste des tâches sur Google Docs, laisser un rappel pour les personnes qui n'ont pas encore saisi de tâche, ou déplacer vers Linear, un logiciel de gestion de tâches, toutes les tâches déjà terminées. L'utilisateur peut suivre en temps réel les actions effectuées par l'agent. Le mode agent peut accéder à l'authentification locale et à l'historique de l'utilisateur, et a été conçu pour être ressenti comme une extension naturelle de lui.
Exemples d'utilisation du mode agent et considérations de sécurité Le mode agent peut également être utilisé à des fins personnelles.
Par exemple, vous pouvez demander à partir d'une page de recette d'identifier les ingrédients nécessaires, calculer les quantités et générer une liste de courses pour faire les courses. ChatGPT mémorise votre boutique préférée, se rend sur le site correspondant et ajoute au panier les articles requis. Le mode agent vous aide ensuite à relire la liste de courses et à ajouter ou supprimer des articles si nécessaire.
Partager le navigateur de l'utilisateur avec un agent ChatGPT peut introduire de nouveaux risques.
C'est pourquoi OpenAI a mis en place des garde-fous : l'agent ChatGPT d'Atlas n'agit que sur les onglets de l'utilisateur, et ne peut pas exécuter du code sur l'ordinateur ni accéder à d'autres fichiers. De plus, l'utilisateur peut choisir si l'agent ChatGPT peut accéder aux sites connectés et aux données, et utiliser le mode privé au besoin. Atlas propose différentes options pour utiliser le mode agent en toute sécurité tout en protégeant vos données personnelles.
Plans futurs OpenAI espère que ChatGPT Atlas sera bien accueilli par les utilisateurs.
Le déploiement à l'échelle mondiale a commencé avec la version macOS, et le mode agent est disponible uniquement pour les utilisateurs Plus et Pro. Les versions Windows, ainsi que celles pour iOS et Android, seront lancées prochainement, selon une montée en puissance progressive. OpenAI prévoit de développer l'idée d'instructions personnalisées qui suivent l'utilisateur sur le web, avec un agent qui le connaît mieux, effectue des tâches pour lui et lui propose à l'avance ce qu'il souhaite. L'entreprise a annoncé qu'elle s'appuierait sur les retours des utilisateurs pour faire évoluer ChatGPT Atlas.
3 commentaires
Je l’ai également téléchargé et testé le jour de la sortie, et j’ai constaté le même comportement que les personnes ci-dessus. Je pense qu’il y aura un correctif, puisqu’il s’agit clairement d’un bug.
Il semble qu'il y ait pas mal de personnes pour qui la saisie en coréen entraîne une séparation des caractères jamo.
Je viens de l’installer tout à l’heure et je l’ai essayé, mais la séparation des jamo ne fonctionne pas de mon côté. J’utilise la version Tahoe (26.0.1).