Comet - l’agent web et navigateur de Perplexity

(perplexity.ai)

7 points par sungmin330 2025-07-31 | 4 commentaires | Partager sur WhatsApp

Comet : le nouveau navigateur créé par Perplexity

La sortie date déjà un peu, mais j’ai pu l’essayer après être passé par la liste d’attente, donc voici mon retour.

Aperçu essentiel

Comet est un navigateur IA développé par Perplexity, conçu pour maximiser la concentration et le workflow de l’utilisateur, et transformer la curiosité en capacité d’exécution.

Fonctions et caractéristiques principales

Recherche IA intégrée, contexte instantané, automatisation des sites
- Résumer, faire du shopping, gérer son agenda et effectuer des recherches directement depuis le navigateur
Comet Assistant
- Prend automatiquement en charge les tâches répétitives comme cliquer, saisir, envoyer et l’autocomplétion
Automatisation même pour les tâches complexes
- Prend en charge tout le parcours d’achat, de la comparaison de produits jusqu’au paiement
Gestion unifiée
- Intégration avec l’e-mail et le calendrier (Gmail, Google Calendar)
- Briefings d’agenda, envoi d’e-mails et planification d’événements directement dans le navigateur
Expérience personnalisée
- Apprend les habitudes d’utilisation pour organiser automatiquement les onglets et les insights
Trouver des réponses directement à partir de mon activité
- Recherche dans les données personnelles comme l’historique, les vidéos et les documents
Actions intelligentes et focus par onglet
- La fonction @tab fournit des réponses en temps réel adaptées à l’onglet ouvert

Cas d’usage

Perplexity a également publié des cas d’usage sur LinkedIn
https://www.linkedin.com/company/perplexity-ai/posts/?feedView=all

Avis personnel après utilisation du service

Technique

Navigateur Chromium + Perplexity + architecture de type Web Agent
Requête en langage naturel -> extraction d’intention/slots -> mapping Semantic DOM -> conversion en actions -> exécution d’événements (web Tool) -> parsing et prétraitement des résultats -> structure estimée de type ReAct
Comet prend des captures d’écran pour permettre de suivre l’état actuel des tâches, mais il reste à vérifier s’il les analyse à l’aide d’un modèle de vision

Cas de test

(1) Rédaction d’e-mail

Utilise correctement le site web de messagerie de Google pour rédiger un e-mail
L’agent n’envoie pas réellement le message et choisit à la place de l’enregistrer en brouillon

(2) Recherche d’itinéraire sur Naver Maps + recommandation de restaurants à proximité

Après avoir ouvert la page web de Naver Maps, je lui ai demandé de trouver un itinéraire entre la gare de Séoul et Jamsil, et il a utilisé le service Naver Maps de manière appropriée (comme le ferait une personne) pour trouver le trajet
Pour la recherche de restaurants à proximité, il n’a pas utilisé Naver Maps mais le Search Tool existant de Perplexity

(3) Scraping des tarifs d’Open AI Platform

Il me semble qu’Open AI Platform utilise Remix, avec certains tarifs d’API masqués derrière des toggles
J’ai explicitement demandé à Comet d’ouvrir les toggles, de vérifier les tarifs de toutes les API et de me rendre le résultat en Markdown, ce qu’il a correctement fait
Cela dit, un peu de prompt engineering est nécessaire pour extraire les informations avec précision
Je lui ai aussi demandé de consulter la page API d’Anthropic, mais la mise en page de la page web (dividers) étant ambiguë, il n’a pas réussi à parser correctement une politique API complexe. En revanche, il a extrait correctement les tarifs API de base.

Avis personnel

En développant un agent de navigation, ils ont probablement dû gérer beaucoup de sujets comme le contexte, le rendu, etc., et je suis curieux de savoir comment ils ont résolu cela.
Techniquement, il y a un vrai effet wow, mais du point de vue produit, cela me semble encore flou.
Cela dépendra des personnes, bien sûr, mais je ne vois pas encore clairement pourquoi je devrais utiliser ce produit, pourquoi je paierais pour utiliser Comet, ni quel problème concret il résoudrait pour moi en tant que client. En d’autres termes, sa proposition de valeur ne m’apparaît pas clairement pour l’instant. Ma réaction actuelle est plutôt : « Oh, c’est impressionnant, ça marche ; je le réessaierai peut-être encore quelques fois quand j’y penserai. »
Bien sûr, Perplexity montre des cas d’usage, mais je me demande : « Est-ce vraiment un problème qui doit être résolu par un agent ? (si je le fais moi-même, c’est plus rapide) » et « Est-ce que tous les vrais problèmes sont vraiment résolus ? »
J’imagine prudemment que ce ressenti vient peut-être du fait que le navigateur est plus proche de l’infrastructure.
Comme un navigateur fondé sur un agent IA constitue en quelque sorte un nouveau format, je pense qu’il faudrait montrer plus clairement aux clients : « Quel est votre problème, et comment Comet peut-il réellement le résoudre parfaitement ? »
Je pense qu’il faut continuer à le surveiller et à l’utiliser davantage. Je me demande comment les problèmes liés au produit pourront être résolus.

UI

Voici mon analyse personnelle. (Je travaille en ce moment à essayer de le reproduire en rétroconception...,)
https://www.figma.com/deck/Gky9ZDEqZKdJfG4RWoNYdf

4 commentaires

cshj55 2025-08-01

Quand vous l’avez testé, y avait-il une limite d’utilisation des requêtes pour cet agent Comet ? Ou bien, comme avec d’autres outils, est-ce que pendant la période de test le nombre de requêtes n’avait pas d’importance ? Il me semble me souvenir qu’il y avait quelque chose comme Pro-Max, donc je me permets de vous poser la question.

sungmin330 2025-08-02

Je suis actuellement abonné à l’offre Pro. C’est peut-être parce que je l’ai relativement peu utilisé, mais jusqu’à présent je n’ai jamais atteint de limite sur Perplexity, Comet compris. J’ai même l’impression que c’est plus souple que prévu.
Comme le plan d’abonnement n’indique pas de ratelimit, il est difficile d’en être certain.
Pour l’instant, on dirait qu’ils ont proposé la bêta différemment de Pro Max.

https://perplexity.ai/help-center/en/…

C’est une impression personnelle, mais comme vous l’avez dit, c’est peut-être parce que c’est une période de test : le nombre de requêtes ne semble pas vraiment avoir d’importance. J’ai même vérifié qu’il était possible de lancer 12 navigateurs virtuels en parallèle d’un seul coup et de faire tourner les tâches. C’est assez impressionnant.

nottiger 2025-08-01

Merci pour cette lecture.
Je suis un peu déçu, car cela semble conforme aux attentes..

cenoch 2025-08-01

Je suis d’accord avec l’idée que, techniquement, il y a un effet wow, mais que du point de vue du produit, cela reste encore flou.

La vitesse d’exécution de l’agent est bien trop lente, et en même temps, ses performances ne sont pas assez fiables pour qu’on puisse lui faire confiance, le laisser travailler et l’oublier.
Il semble impossible de choisir le modèle, donc la plupart des tâches paraissent sans doute être effectuées avec le modèle maison de Perplexity, mais les hallucinations sont bien trop fréquentes.
Ex. : quand on lui demande de lire une page d’actualités Naver et de résumer, pour chaque journal, la tonalité de ses articles sur les négociations tarifaires, il invente la tonalité de journaux qu’il n’a pas lus en se basant sur des « préjugés préalablement appris sur l’orientation de chaque média », puis répond comme si c’était réel.
Pour lui faire exécuter correctement ce type de travail, il faut du prompt engineering ainsi que des vérifications/corrections répétées, et le coût d’attention que cela demande semble supérieur au bénéfice qu’on pourrait tirer de l’automatisation via Comet.
On voit bien les difficultés techniques auxquelles ils ont dû se heurter pendant le développement, donc il y a des aspects intéressants à observer de ce point de vue en tant que « développeur », mais en tant que produit...