- Une nouvelle façon d’utiliser le navigateur
- Automatise les tâches dans le navigateur grâce aux puissantes capacités de compréhension et de raisonnement multimodaux de Gemini 2.0
- Comprend et raisonne sur tous les éléments de l’écran du navigateur : pixels, texte, code, images, formulaires, etc.
- Native Multimodality : comprend et raisonne sur tous les contenus affichés dans le navigateur
- Analyse des éléments complexes d’un site web, comme le texte, le code et les images
- Répond aux commandes vocales et fournit un retour visuel sur l’avancement des tâches
- Browser Interaction : comprend et explore en temps réel des sites web complexes
- Interagit avec les sites web à la place de l’utilisateur
- Automatise les tâches répétitives pour faire gagner du temps
- Demande des explications claires lorsqu’il ne comprend pas une instruction
- Reasoning : comprend des consignes complexes et les décompose en étapes exécutables pour les accomplir
- Identifie les relations entre les éléments du web et leurs fonctions
- Affiche de manière transparente le plan de travail et le processus d’exécution afin que l’utilisateur puisse comprendre le processus de décision
- Actuellement disponible uniquement pour un petit groupe de test de confiance : inscription sur liste d’attente requise pour participer aux tests
1 commentaires
Un navigateur headless optimisé pour l’IA apparaît…
Les serveurs web renvoient des réponses optimisées pour ce navigateur…
Le jour où ils dialogueront entre eux n’est plus si loin…