8 points par xguru 2024-12-18 | 1 commentaires | Partager sur WhatsApp
  • Une nouvelle façon d’utiliser le navigateur
  • Automatise les tâches dans le navigateur grâce aux puissantes capacités de compréhension et de raisonnement multimodaux de Gemini 2.0
  • Comprend et raisonne sur tous les éléments de l’écran du navigateur : pixels, texte, code, images, formulaires, etc.
  • Native Multimodality : comprend et raisonne sur tous les contenus affichés dans le navigateur
    • Analyse des éléments complexes d’un site web, comme le texte, le code et les images
    • Répond aux commandes vocales et fournit un retour visuel sur l’avancement des tâches
  • Browser Interaction : comprend et explore en temps réel des sites web complexes
    • Interagit avec les sites web à la place de l’utilisateur
    • Automatise les tâches répétitives pour faire gagner du temps
    • Demande des explications claires lorsqu’il ne comprend pas une instruction
  • Reasoning : comprend des consignes complexes et les décompose en étapes exécutables pour les accomplir
    • Identifie les relations entre les éléments du web et leurs fonctions
    • Affiche de manière transparente le plan de travail et le processus d’exécution afin que l’utilisateur puisse comprendre le processus de décision
  • Actuellement disponible uniquement pour un petit groupe de test de confiance : inscription sur liste d’attente requise pour participer aux tests

1 commentaires

 
iolothebard 2024-12-18

Un navigateur headless optimisé pour l’IA apparaît…
Les serveurs web renvoient des réponses optimisées pour ce navigateur…
Le jour où ils dialogueront entre eux n’est plus si loin…