- Gemini 3 Flash est le dernier modèle d’IA de Google, offrant une intelligence de niveau frontier avec une grande rapidité et un faible coût
- Il conserve des capacités de raisonnement au niveau de Gemini 3 Pro tout en combinant la latence et l’efficacité de la série Flash, afin de prendre en charge les tâches du quotidien et les workflows agentiques
- Il surpasse Gemini 2.5 Pro sur des benchmarks majeurs comme GPQA Diamond 90.4%, Humanity’s Last Exam 33.7% et MMMU Pro 81.2%
- Les développeurs peuvent y accéder via Google AI Studio, Gemini CLI, Antigravity, Vertex AI, tandis que le grand public peut l’utiliser gratuitement via l’application Gemini et le mode IA de la recherche
- Il redéfinit l’équilibre entre vitesse, coût et intelligence, et s’impose comme un modèle extensible aussi bien pour les grands volumes d’utilisateurs que pour les environnements d’entreprise
Présentation de Gemini 3 Flash
- Gemini 3 Flash est une extension de la famille de modèles Gemini 3, un modèle de nouvelle génération maximisant la vitesse et l’efficacité
- Il a été dévoilé après Gemini 3 Pro et le mode Deep Think, et plus de 1 trillion de tokens par jour sont déjà traités via l’API
- Divers cas d’usage ont été rapportés, comme l’apprentissage de sujets complexes, la conception de jeux interactifs et la compréhension de contenus multimodaux
- Il conserve les capacités avancées de raisonnement, de compréhension visuelle et de codage agentique de Gemini 3, tout en y ajoutant la latence et l’efficacité coût de Flash
- Il a été conçu comme un modèle optimisé pour améliorer la précision des tâches du quotidien et pour les workflows agentiques
Performances et benchmarks
- Gemini 3 Flash démontre que la vitesse et l’échelle ne se font pas au détriment de l’intelligence
- Avec GPQA Diamond 90.4%, Humanity’s Last Exam 33.7% (sans outils) et MMMU Pro 81.2%, il affiche des performances comparables à celles des grands modèles
- Il enregistre des résultats supérieurs à Gemini 2.5 Pro sur de nombreux benchmarks
- Il repousse la frontière de Pareto entre qualité, coût et vitesse
- Sur les tâches complexes, il réfléchit plus longtemps, tout en maintenant de hautes performances avec 30% de tokens utilisés en moins en moyenne sur le trafic courant
- Selon Artificial Analysis, il est 3 fois plus rapide que 2.5 Pro, pour un coût de $0.50 par million de tokens en entrée et $3.00 en sortie
- L’entrée audio coûte $1.00 par million de tokens
Fonctionnalités pour les développeurs
- Il offre des performances de codage à faible latence adaptées au développement itératif et aux workflows à haute fréquence
- Sur le benchmark SWE-bench Verified, il obtient un score de 78%, dépassant à la fois la série 2.5 et Gemini 3 Pro
- Il excelle dans les tâches multimodales complexes comme l’analyse vidéo, l’extraction de données et les questions-réponses visuelles
- Il prend en charge la création d’applications intelligentes pour l’assistance en jeu en temps réel, les tests A/B ou l’automatisation du design
- Des entreprises comme JetBrains, Bridgewater Associates et Figma l’ont déjà adopté, avec une disponibilité via Vertex AI et Gemini Enterprise
Fonctionnalités pour le grand public
- Il remplace 2.5 Flash comme modèle par défaut de l’application Gemini et est disponible gratuitement pour les utilisateurs du monde entier
- Ses capacités de raisonnement multimodal sont renforcées, notamment pour générer des plans d’action concrets à partir d’analyses vidéo ou image
- Exemples : analyse d’un swing de golf, reconnaissance de dessins, création de quiz personnalisés à partir d’audio
- Il permet de créer un prototype d’application à la voix uniquement, afin que même des non-spécialistes puissent concevoir rapidement une app
- Il devient aussi le modèle par défaut dans le mode IA de la recherche
- En s’appuyant sur la capacité de raisonnement de Gemini 3 Pro, il analyse finement le contexte des questions et fournit des réponses organisées visuellement avec des informations en temps réel
- Il est particulièrement à l’aise avec les objectifs en plusieurs étapes, comme la planification de voyages complexes ou l’apprentissage de notions pédagogiques
Accès et déploiement
- Pour les développeurs : disponible en preview dans Google AI Studio, Gemini CLI, Antigravity, Vertex AI et Gemini Enterprise
- Pour le grand public : déploiement progressif à l’échelle mondiale dans l’application Gemini et le mode IA de Google Search
- Gemini 3 Flash vient renforcer, aux côtés de Gemini 3 Pro et Deep Think, les piliers majeurs de la famille Gemini 3
1 commentaires
Commentaires Hacker News
Il ne faut pas se laisser tromper par le nom « Flash ». Ce modèle affiche des performances vraiment étonnantes
Je l’utilise depuis quelques semaines : il est rapide et sa couverture des connaissances est large, donc bien plus efficace que Claude Opus 4.5 ou GPT 5.2 Extra High. Le temps de raisonnement et le coût sont presque divisés par dix
Le temps de réponse reste le même, mais les résultats sont bien meilleurs. Le rapport qualité-prix est dingue
Je me demande quelle différence technique Google a introduite entre les modèles Pro et Flash pour obtenir ce niveau de performance
Pour info, j’utilise souvent l’API Gemini et j’aime tester chaque nouveau modèle avec mes benchmarks internes
Pourtant, Gemini 3 Flash est le premier à avoir donné une réponse presque juste à l’une de mes questions de benchmark très spécifiques
L’échantillon reste limité, mais l’amélioration de la précision est clairement visible
La stratégie qui consiste à vouloir tout résoudre avec un seul GPT 5 est un échec.
Je teste Gemini 3 Flash en ce moment, et il fait mieux que GPT 5 Thinking à la fois en latence et en performances
OpenAI devrait se concentrer sur des modèles utiles en pratique plutôt que sur la publicité
Les résultats détaillés sont disponibles sur la page d’évaluation d’Artificial Analysis
Cette sortie est appréciable parce qu’elle semble utilisable directement en production, sans passer par une preview
Mais les hausses de prix continuent
Par exemple, Gemini 1.5 Flash coûtait $0.075/M en entrée, contre jusqu’à $0.50/M pour 3.0 Flash
Le modèle Pro est à environ $2/M en entrée et $12/M en sortie
Correction : ce modèle aussi est une version preview
Pour la plupart des usages hors code, la différence entre Flash et Flash Lite peut être plus importante que celle avec Pro
Mais la concurrence est féroce, donc j’imagine qu’un modèle moins cher à performances comparables arrivera bientôt
On a vraiment l’impression que Google a réussi à réunir vitesse, prix et qualité
Si on ajoute l’intégration à Android et à G Suite, c’est une combinaison énorme
Cela ressemble probablement à une stratégie pour lancer un smartphone AI-first avant le projet matériel OpenAI–Jony Ive ou Apple Intelligence
Par exemple, Gemini 3 Pro est lent et échoue souvent même sur de simples appels à l’outil
EditLà où Claude-Code termine la même tâche en 5 minutes, Gemini en met 27
Je pense plutôt qu’une tablette ou des lunettes connectées seraient plus adaptées pour exploiter une smol AI
Gemini 3 Flash (non-thinking) est le premier modèle à obtenir 50 % à mon « test du nombre de pattes du chien »
Quand je lui montre une image composite avec 5 pattes, la plupart des modèles répondent 4, mais 3 Flash répond correctement 5
Il n’a compté juste que lorsque j’ai ajouté des tatouages sur les pattes ; sans tatouages, il répond encore 4
Ça mérite bien la moitié des points
Les modèles Flash deviennent de plus en plus chers, mais ce 3.0 Flash a un rapport performance/prix délirant
Il obtient 78 % sur les benchmarks, dépassant à la fois la série 2.5 et 3 Pro
Il est idéal pour le coding agentique et les applications interactives en temps réel
Pour les utilisateurs de 2.5 Flash, la montée en gamme fera peut-être un peu mal côté budget, mais elle en vaut la peine
Ceux qui veulent du low cost ont déjà Flash Lite, donc l’équilibre tient la route
Il est rapide, intelligent et prend aussi en charge un contexte de 1M
J’aimerais voir des modèles à poids ouverts devenir compétitifs sur ce segment
J’ai déjà l’impression d’avoir atteint un niveau « suffisamment bon » avec la combinaison Claude Code + Gemini
Il devient désormais difficile pour une autre entreprise de me convaincre.
Avec cette sortie, on atteint le point où « assez bon et assez bon marché » se croisent
Il suffit de changer le modèle sélectionné dans un CLI ou un plugin IDE
Leur précision était beaucoup trop aléatoire
Les entreprises veulent une intelligence illimitée, mais les particuliers n’ont pas besoin d’aller aussi loin
Il a obtenu 69 % sur le benchmark SimpleQA, qui est un test de connaissances extrêmement rares
Quand on sait que Gemini 2.5 Pro était à 55 %, c’est un score énorme
Google semble avoir bien exploité la compression des connaissances ou une architecture MoE (mélange d’experts)
Je ne comprends pas bien la différence entre « Thinking » et « Pro » dans Gemini 3
La description parle de « résolution de problèmes complexes » contre « réflexion longue pour les maths avancées et le code »
C’est probablement une question de budget de réflexion
thinking_levelGemini reste toujours dans une réflexion déclenchée par requête.
En ajoutant des boucles et un contexte persistant, cela pourrait ressembler à de l’AGI, mais le coût exploserait
Google a probablement déjà fait ce genre d’expériences
Mon principal reproche est l’absence de fonction de suppression des conversations
Sur les comptes professionnels, on ne peut pas supprimer des conversations individuelles ; on peut seulement définir une durée de rétention globale, avec un minimum de 3 mois
En tant qu’utilisateur payant, je trouve les fonctions de base insuffisantes par rapport à des tarifs qui ne cessent d’augmenter
Pour une comparaison rapide des prix, selon LLM Prices,
Gemini 3 Flash coûte 1/4 du prix de Pro ≤200k et 1/8 du prix de Pro >200k
Le fait que le prix n’augmente pas après 200k tokens est impressionnant
En entrée, il coûte deux fois plus que GPT-5 Mini et la moitié du prix de Claude 4.5 Haiku