Comet - l’agent web et navigateur de Perplexity
(perplexity.ai)Comet : le nouveau navigateur créé par Perplexity
La sortie date déjà un peu, mais j’ai pu l’essayer après être passé par la liste d’attente, donc voici mon retour.
Aperçu essentiel
Comet est un navigateur IA développé par Perplexity, conçu pour maximiser la concentration et le workflow de l’utilisateur, et transformer la curiosité en capacité d’exécution.
Fonctions et caractéristiques principales
-
Recherche IA intégrée, contexte instantané, automatisation des sites
- Résumer, faire du shopping, gérer son agenda et effectuer des recherches directement depuis le navigateur
-
Comet Assistant
- Prend automatiquement en charge les tâches répétitives comme cliquer, saisir, envoyer et l’autocomplétion
-
Automatisation même pour les tâches complexes
- Prend en charge tout le parcours d’achat, de la comparaison de produits jusqu’au paiement
-
Gestion unifiée
- Intégration avec l’e-mail et le calendrier (Gmail, Google Calendar)
- Briefings d’agenda, envoi d’e-mails et planification d’événements directement dans le navigateur
-
Expérience personnalisée
- Apprend les habitudes d’utilisation pour organiser automatiquement les onglets et les insights
-
Trouver des réponses directement à partir de mon activité
- Recherche dans les données personnelles comme l’historique, les vidéos et les documents
-
Actions intelligentes et focus par onglet
- La fonction
@tabfournit des réponses en temps réel adaptées à l’onglet ouvert
- La fonction
Cas d’usage
Perplexity a également publié des cas d’usage sur LinkedIn
https://www.linkedin.com/company/perplexity-ai/posts/?feedView=all
Avis personnel après utilisation du service
Technique
- Navigateur Chromium + Perplexity + architecture de type Web Agent
- Requête en langage naturel -> extraction d’intention/slots -> mapping Semantic DOM -> conversion en actions -> exécution d’événements (web Tool) -> parsing et prétraitement des résultats -> structure estimée de type ReAct
- Comet prend des captures d’écran pour permettre de suivre l’état actuel des tâches, mais il reste à vérifier s’il les analyse à l’aide d’un modèle de vision
Cas de test
(1) Rédaction d’e-mail
- Utilise correctement le site web de messagerie de Google pour rédiger un e-mail
- L’agent n’envoie pas réellement le message et choisit à la place de l’enregistrer en brouillon
(2) Recherche d’itinéraire sur Naver Maps + recommandation de restaurants à proximité
- Après avoir ouvert la page web de Naver Maps, je lui ai demandé de trouver un itinéraire entre la gare de Séoul et Jamsil, et il a utilisé le service Naver Maps de manière appropriée (comme le ferait une personne) pour trouver le trajet
- Pour la recherche de restaurants à proximité, il n’a pas utilisé Naver Maps mais le Search Tool existant de Perplexity
(3) Scraping des tarifs d’Open AI Platform
- Il me semble qu’Open AI Platform utilise Remix, avec certains tarifs d’API masqués derrière des toggles
- J’ai explicitement demandé à Comet d’ouvrir les toggles, de vérifier les tarifs de toutes les API et de me rendre le résultat en Markdown, ce qu’il a correctement fait
- Cela dit, un peu de prompt engineering est nécessaire pour extraire les informations avec précision
- Je lui ai aussi demandé de consulter la page API d’Anthropic, mais la mise en page de la page web (dividers) étant ambiguë, il n’a pas réussi à parser correctement une politique API complexe. En revanche, il a extrait correctement les tarifs API de base.
Avis personnel
- En développant un agent de navigation, ils ont probablement dû gérer beaucoup de sujets comme le contexte, le rendu, etc., et je suis curieux de savoir comment ils ont résolu cela.
- Techniquement, il y a un vrai effet wow, mais du point de vue produit, cela me semble encore flou.
- Cela dépendra des personnes, bien sûr, mais je ne vois pas encore clairement pourquoi je devrais utiliser ce produit, pourquoi je paierais pour utiliser Comet, ni quel problème concret il résoudrait pour moi en tant que client. En d’autres termes, sa proposition de valeur ne m’apparaît pas clairement pour l’instant. Ma réaction actuelle est plutôt : « Oh, c’est impressionnant, ça marche ; je le réessaierai peut-être encore quelques fois quand j’y penserai. »
- Bien sûr, Perplexity montre des cas d’usage, mais je me demande : « Est-ce vraiment un problème qui doit être résolu par un agent ? (si je le fais moi-même, c’est plus rapide) » et « Est-ce que tous les vrais problèmes sont vraiment résolus ? »
- J’imagine prudemment que ce ressenti vient peut-être du fait que le navigateur est plus proche de l’infrastructure.
- Comme un navigateur fondé sur un agent IA constitue en quelque sorte un nouveau format, je pense qu’il faudrait montrer plus clairement aux clients : « Quel est votre problème, et comment Comet peut-il réellement le résoudre parfaitement ? »
- Je pense qu’il faut continuer à le surveiller et à l’utiliser davantage. Je me demande comment les problèmes liés au produit pourront être résolus.
UI
Voici mon analyse personnelle. (Je travaille en ce moment à essayer de le reproduire en rétroconception...,)
https://www.figma.com/deck/Gky9ZDEqZKdJfG4RWoNYdf
4 commentaires
Quand vous l’avez testé, y avait-il une limite d’utilisation des requêtes pour cet agent Comet ? Ou bien, comme avec d’autres outils, est-ce que pendant la période de test le nombre de requêtes n’avait pas d’importance ? Il me semble me souvenir qu’il y avait quelque chose comme Pro-Max, donc je me permets de vous poser la question.
Je suis actuellement abonné à l’offre Pro. C’est peut-être parce que je l’ai relativement peu utilisé, mais jusqu’à présent je n’ai jamais atteint de limite sur Perplexity, Comet compris. J’ai même l’impression que c’est plus souple que prévu.
Comme le plan d’abonnement n’indique pas de ratelimit, il est difficile d’en être certain.
Pour l’instant, on dirait qu’ils ont proposé la bêta différemment de Pro Max.
https://perplexity.ai/help-center/en/…
C’est une impression personnelle, mais comme vous l’avez dit, c’est peut-être parce que c’est une période de test : le nombre de requêtes ne semble pas vraiment avoir d’importance. J’ai même vérifié qu’il était possible de lancer 12 navigateurs virtuels en parallèle d’un seul coup et de faire tourner les tâches. C’est assez impressionnant.
Merci pour cette lecture.
Je suis un peu déçu, car cela semble conforme aux attentes..
Ex. : quand on lui demande de lire une page d’actualités Naver et de résumer, pour chaque journal, la tonalité de ses articles sur les négociations tarifaires, il invente la tonalité de journaux qu’il n’a pas lus en se basant sur des « préjugés préalablement appris sur l’orientation de chaque média », puis répond comme si c’était réel.