- Gemini 3 Flash est le dernier modèle d’IA de Google, offrant une intelligence de niveau frontier avec une grande rapidité et un faible coût
- Il conserve des capacités de raisonnement au niveau de Gemini 3 Pro tout en combinant la latence et l’efficacité de la série Flash, afin de prendre en charge les tâches du quotidien et les workflows agentiques
- Il surpasse Gemini 2.5 Pro sur des benchmarks majeurs comme GPQA Diamond 90.4%, Humanity’s Last Exam 33.7% et MMMU Pro 81.2%
- Les développeurs peuvent y accéder via Google AI Studio, Gemini CLI, Antigravity, Vertex AI, tandis que le grand public peut l’utiliser gratuitement via l’application Gemini et le mode IA de la recherche
- Il redéfinit l’équilibre entre vitesse, coût et intelligence, et s’impose comme un modèle extensible aussi bien pour les grands volumes d’utilisateurs que pour les environnements d’entreprise
Présentation de Gemini 3 Flash
- Gemini 3 Flash est une extension de la famille de modèles Gemini 3, un modèle de nouvelle génération maximisant la vitesse et l’efficacité
- Il a été dévoilé après Gemini 3 Pro et le mode Deep Think, et plus de 1 trillion de tokens par jour sont déjà traités via l’API
- Divers cas d’usage ont été rapportés, comme l’apprentissage de sujets complexes, la conception de jeux interactifs et la compréhension de contenus multimodaux
- Il conserve les capacités avancées de raisonnement, de compréhension visuelle et de codage agentique de Gemini 3, tout en y ajoutant la latence et l’efficacité coût de Flash
- Il a été conçu comme un modèle optimisé pour améliorer la précision des tâches du quotidien et pour les workflows agentiques
Performances et benchmarks
- Gemini 3 Flash démontre que la vitesse et l’échelle ne se font pas au détriment de l’intelligence
- Avec GPQA Diamond 90.4%, Humanity’s Last Exam 33.7% (sans outils) et MMMU Pro 81.2%, il affiche des performances comparables à celles des grands modèles
- Il enregistre des résultats supérieurs à Gemini 2.5 Pro sur de nombreux benchmarks
- Il repousse la frontière de Pareto entre qualité, coût et vitesse
- Sur les tâches complexes, il réfléchit plus longtemps, tout en maintenant de hautes performances avec 30% de tokens utilisés en moins en moyenne sur le trafic courant
- Selon Artificial Analysis, il est 3 fois plus rapide que 2.5 Pro, pour un coût de $0.50 par million de tokens en entrée et $3.00 en sortie
- L’entrée audio coûte $1.00 par million de tokens
Fonctionnalités pour les développeurs
- Il offre des performances de codage à faible latence adaptées au développement itératif et aux workflows à haute fréquence
- Sur le benchmark SWE-bench Verified, il obtient un score de 78%, dépassant à la fois la série 2.5 et Gemini 3 Pro
- Il excelle dans les tâches multimodales complexes comme l’analyse vidéo, l’extraction de données et les questions-réponses visuelles
- Il prend en charge la création d’applications intelligentes pour l’assistance en jeu en temps réel, les tests A/B ou l’automatisation du design
- Des entreprises comme JetBrains, Bridgewater Associates et Figma l’ont déjà adopté, avec une disponibilité via Vertex AI et Gemini Enterprise
Fonctionnalités pour le grand public
- Il remplace 2.5 Flash comme modèle par défaut de l’application Gemini et est disponible gratuitement pour les utilisateurs du monde entier
- Ses capacités de raisonnement multimodal sont renforcées, notamment pour générer des plans d’action concrets à partir d’analyses vidéo ou image
- Exemples : analyse d’un swing de golf, reconnaissance de dessins, création de quiz personnalisés à partir d’audio
- Il permet de créer un prototype d’application à la voix uniquement, afin que même des non-spécialistes puissent concevoir rapidement une app
- Il devient aussi le modèle par défaut dans le mode IA de la recherche
- En s’appuyant sur la capacité de raisonnement de Gemini 3 Pro, il analyse finement le contexte des questions et fournit des réponses organisées visuellement avec des informations en temps réel
- Il est particulièrement à l’aise avec les objectifs en plusieurs étapes, comme la planification de voyages complexes ou l’apprentissage de notions pédagogiques
Accès et déploiement
- Pour les développeurs : disponible en preview dans Google AI Studio, Gemini CLI, Antigravity, Vertex AI et Gemini Enterprise
- Pour le grand public : déploiement progressif à l’échelle mondiale dans l’application Gemini et le mode IA de Google Search
- Gemini 3 Flash vient renforcer, aux côtés de Gemini 3 Pro et Deep Think, les piliers majeurs de la famille Gemini 3
Aucun commentaire pour le moment.