- Gemini 1.0 a marqué une avancée majeure en tant que modèle multimodal capable de traiter des informations en texte, vidéo, image, audio et code
- Gemini 2.0 pousse cette vision plus loin et évolue vers un modèle agentique capable de comprendre le monde, de planifier plusieurs étapes et d’exécuter des tâches
- Gemini 2.0 est intégré à des produits majeurs comme Google Search, lui donnant la capacité de traiter des sujets plus complexes et des questions en plusieurs étapes
Principales caractéristiques de Gemini 2.0 Flash
- S’appuie sur le succès de 1.5 Flash pour offrir des performances encore meilleures et des temps de réponse plus rapides
- Deux fois plus rapide que 1.5 Pro, avec de meilleurs résultats sur les principaux benchmarks
- Prend en charge les entrées multimodales comme les images, les vidéos et l’audio, ainsi que la génération d’images mêlées au texte et la synthèse vocale multilingue
- Peut appeler nativement des outils comme Google Search, l’exécution de code et des fonctions personnalisées
- D’abord proposé aux développeurs et à des testeurs de confiance, avant un déploiement plus large prévu au début de l’année prochaine
Présentation des projets de recherche
- Project Astra : un assistant IA universel doté de capacités de mémoire améliorées
- Amélioration de fonctionnalités comme les conversations multilingues, l’utilisation de Google Search/Lens/Maps et une mémoire de session d’environ 10 minutes
- Continue d’évoluer en recueillant les retours de testeurs de confiance via des appareils Android
- Project Mariner : un prototype de recherche capable d’interagir avec le navigateur pour aider à accomplir des tâches complexes
- A atteint un score élevé de 83,5 % sur le benchmark WebVoyager
- Intègre une mesure de sécurité demandant une confirmation avant que l’utilisateur n’approuve l’action finale
- Jules : un agent de codage alimenté par l’IA et intégré aux workflows GitHub
- Aide les développeurs à résoudre des issues et à exécuter des plans
Domaines d’application des agents IA
- Explore l’usage d’agents IA dans les jeux en collaboration avec le studio Supercell
- Mène des expérimentations pour appliquer les capacités de raisonnement spatial de Gemini 2.0 au domaine de la robotique
Sécurité et développement responsable
- Adopte une approche progressive et exploratoire dans le développement des nouvelles technologies
- Génère automatiquement la détection des risques et des mesures d’atténuation via une approche de red team assistée par l’IA
- Dans Project Mariner, met en œuvre des fonctions pour protéger les utilisateurs contre les tentatives malveillantes d’injection de prompt
- Fournit des contrôles de protection de la vie privée et des fonctions de suppression de session
Plans à venir
- Prévoit d’étendre les capacités de Gemini 2.0 à l’application Gemini et à d’autres produits Google
- Continuera de faire de la sécurité et de la responsabilité la priorité absolue dans sa progression vers l’AGI
1 commentaires
Avis sur Hacker News
Le nouveau plugin llm-gemini prend en charge le modèle Gemini 2.0 Flash. Partage d'une méthode d'utilisation dans le terminal
Les grandes entreprises changent lentement de direction, mais une fois la trajectoire fixée, elles peuvent accomplir ce que les petites entreprises ne peuvent pas faire
Dépasse Gemini 1.5 Pro sur la plupart des benchmarks
Un nouveau SDK a été annoncé. Il semble suivre les bonnes pratiques modernes
Ravi que la nouvelle release de Google soit disponible immédiatement
Le mot "agentic" donne une impression désagréable
Les modèles Gemini 2 prennent en charge la génération audio et d'images
Gemini 2 devance 4o dans Chatbot Arena
Le mot "agentic" semble inapproprié
Accès à Gemini 2.0 Flash via Google AI Studio dans le navigateur Safari sur iPhone