Project Mariner de Google DeepMind - outil d’automatisation du navigateur

xguru · 2024-12-18T11:07:01+09:00

Une nouvelle façon d’utiliser le navigateur Automatise les tâches dans le navigateur grâce aux puissantes capacités de compréhension et de raisonnement multimodaux de Gemini 2.0 Comprend et raisonne sur tous les éléments de l’écran du navigateur : pixels, texte, code, images, formulaires, etc. Native Multimodality : comprend et raisonne sur tous les contenus affichés dans le navigateur Analyse des éléments complexes d’un site web, comme le texte, le code et les images Répond aux commandes vocales et fournit un retour visuel sur l’avancement des tâches Browser Interaction : comprend et explore en temps réel des sites web complexes Interagit avec les sites web à la place de l’utilisateur Automatise les tâches répétitives pour faire gagner du temps Demande des explications claires lorsqu’il ne comprend pas une instruction Reasoning : comprend des consignes complexes et les décompose en étapes exécutables pour les accomplir Identifie les relations entre les éléments du web et leurs fonctions Affiche de manière transparente le plan de travail et le processus d’exécution afin que l’utilisateur puisse comprendre le processus de décision Actuellement disponible uniquement pour un petit groupe de test de confiance : inscription sur liste d’attente requise pour participer aux tests

(deepmind.google)

8 points par xguru 2024-12-18 | 1 commentaires | Partager sur WhatsApp

Une nouvelle façon d’utiliser le navigateur
Automatise les tâches dans le navigateur grâce aux puissantes capacités de compréhension et de raisonnement multimodaux de Gemini 2.0
Comprend et raisonne sur tous les éléments de l’écran du navigateur : pixels, texte, code, images, formulaires, etc.
Native Multimodality : comprend et raisonne sur tous les contenus affichés dans le navigateur
- Analyse des éléments complexes d’un site web, comme le texte, le code et les images
- Répond aux commandes vocales et fournit un retour visuel sur l’avancement des tâches
Browser Interaction : comprend et explore en temps réel des sites web complexes
- Interagit avec les sites web à la place de l’utilisateur
- Automatise les tâches répétitives pour faire gagner du temps
- Demande des explications claires lorsqu’il ne comprend pas une instruction
Reasoning : comprend des consignes complexes et les décompose en étapes exécutables pour les accomplir
- Identifie les relations entre les éléments du web et leurs fonctions
- Affiche de manière transparente le plan de travail et le processus d’exécution afin que l’utilisateur puisse comprendre le processus de décision
Actuellement disponible uniquement pour un petit groupe de test de confiance : inscription sur liste d’attente requise pour participer aux tests

1 commentaires

iolothebard 2024-12-18

Un navigateur headless optimisé pour l’IA apparaît…
Les serveurs web renvoient des réponses optimisées pour ce navigateur…
Le jour où ils dialogueront entre eux n’est plus si loin…

Project Mariner de Google DeepMind - outil d’automatisation du navigateur

À lire aussi

1 commentaires