- Google a dévoilé de nouvelles versions preview de Gemini 2.5 Flash et 2.5 Flash-Lite, avec comme axes principaux une meilleure qualité et une efficacité accrue
- Flash-Lite est optimisé pour les environnements à haute vitesse et à faible coût grâce à une meilleure compréhension des consignes, des réponses moins verbeuses et des capacités multimodales et de traduction améliorées
- Flash offre de meilleures capacités d’utilisation des outils et une meilleure efficacité en tokens, ce qui améliore fortement les performances sur les tâches agentiques complexes
- Lors de tests réels, le score SWE-Bench Verified a progressé de 5 %, et dans les benchmarks internes, les performances sur les tâches de longue durée ont augmenté de 15 %
- Les deux modèles prennent en charge l’alias
-latest, permettant d’utiliser les dernières fonctionnalités sans modifier le code, tandis que les modèles 2.5 existants restent disponibles pour ceux qui privilégient la stabilité
Aperçu de Gemini 2.5 Flash et Flash-Lite
- Les dernières versions de Gemini 2.5 Flash et Flash-Lite sont disponibles sur Google AI Studio et Vertex AI. Cette release vise à fournir en continu une meilleure qualité de modèle et une efficacité plus élevée
- Les nouveaux Flash-Lite et Flash affichent des performances nettement supérieures aux modèles précédents en termes de qualité globale, de vitesse et de coût
- Flash-Lite réduit les tokens de sortie de 50 %, et Flash de 24 %, ce qui permet de réduire les coûts d’exécution et d’accélérer le traitement
Updated Gemini 2.5 Flash-Lite
- Meilleur suivi des consignes : la compréhension et l’exécution des instructions complexes ou des system prompts ont été fortement améliorées
- Plus de concision : génération de réponses plus courtes et plus faciles à comprendre, avec à la clé une baisse du coût en tokens et une réduction de la latence dans les environnements à fort trafic
- Renforcement de la qualité multimodale et de traduction : la fiabilité progresse sur les transcriptions audio, la reconnaissance d’image et la qualité de traduction
- La version preview de Flash-Lite peut être testée immédiatement sous le nom de modèle
gemini-2.5-flash-lite-preview-09-2025
Updated Gemini 2.5 Flash
- Capacités d’utilisation des outils renforcées : l’usage agentique dans des situations complexes à plusieurs étapes progresse fortement, avec un score SWE-Bench Verified en hausse de 5 points par rapport à la version précédente (48.9 % → 54 %)
- Meilleure efficacité économique : une qualité de sortie supérieure avec moins de tokens utilisés, ce qui réduit la latence et les coûts d’infrastructure
- Les retours des utilisateurs de Primer sont également positifs
- Yichao ‘Peak’ Ji, cofondateur et Chief Scientist de Manus, a déclaré : « Le nouveau modèle Gemini 2.5 Flash combine une vitesse et une intelligence remarquables. Sur les tâches agentiques orientées vers des objectifs de long terme, les performances se sont améliorées de 15 %, ce qui permet de passer davantage à l’échelle grâce à une meilleure efficacité économique »
- La version preview de Gemini 2.5 Flash est disponible sous le nom de modèle
gemini-2.5-flash-preview-09-2025
Commencer à construire avec Gemini
- Au cours de l’année écoulée, la publication de modèles preview a permis aux développeurs de tester rapidement les dernières fonctionnalités et de fournir des retours.
- Les versions preview annoncées aujourd’hui ne deviennent pas officiellement de nouvelles versions stables, mais servent de base pour améliorer la qualité de la prochaine version officielle
- Un alias
-latest a été ajouté pour éviter les noms de modèles à rallonge et permettre d’utiliser facilement en permanence le modèle le plus récent. Cet alias pointe automatiquement vers la dernière version, ce qui permet d’essayer de nouvelles fonctionnalités sans modifier le code
gemini-flash-latest
gemini-flash-lite-latest
- Si une version spécifique est mise à jour ou interrompue, une notification sera envoyée par e-mail au moins deux semaines à l’avance. L’alias n’est qu’une simple référence, et le prix, les fonctionnalités et les limites peuvent varier selon les releases
- Pour les besoins de stabilité à long terme, il est recommandé de continuer à utiliser les noms de modèles existants
gemini-2.5-flash et gemini-2.5-flash-lite
Signification
- Cette release est une mise à jour preview et non une promotion vers une version stable officielle ; elle s’inscrit dans un processus d’expérimentation et de collecte de retours utilisateurs en vue des futurs modèles stables
- Avec Gemini, Google cherche à équilibrer vitesse, intelligence et efficacité économique, et poursuit ses améliorations pour aider les développeurs à créer de meilleures applications d’IA
1 commentaires
Avis Hacker News
application/json, l’usage des outils devient impossible, et pour avoir les deux il faut soit espérer que le JSON sorte correctement de force (ce qui échoue souvent), soit utiliser les outils dans une première requête puis formater dans une deuxième. C’est pénible, mais le contournement reste assez simpleVoir les notes de version ici. Pour la discussion sur le pélican, voir ce message
gemini-2.5-flash-lite-preview-09-2025etgemini-2.5-flash-preview-09-2025