1 points par GN⁺ 2025-06-26 | 1 commentaires | Partager sur WhatsApp
  • Google a récemment dévoilé Gemini CLI, un agent IA open source
  • Cet outil permet d’utiliser directement les capacités d’intelligence artificielle des modèles Gemini dans un environnement en ligne de commande
  • Les développeurs peuvent effectuer directement depuis le CLI diverses tâches comme la génération de code, le résumé de documents et la traduction
  • Gemini CLI se distingue par son extensibilité, sa personnalisation et son accessibilité open source
  • Par rapport aux agents IA existants, il offre comme avantages une plus grande praticité et un gain de productivité

Présentation de Gemini CLI

  • Google a présenté Gemini CLI afin d’aider les développeurs à utiliser facilement des fonctions d’intelligence artificielle dans un environnement en ligne de commande
  • Gemini CLI s’appuie sur les modèles Gemini de Google et fournit de manière intégrée diverses fonctions d’IA comme l’automatisation des tâches de développement courantes, le traitement du langage naturel, la traduction, la génération de code et le résumé de documents
  • Proposé en open source, il peut être librement personnalisé et étendu, et offre un environnement permettant de développer divers plugins et extensions adaptés aux besoins de la communauté des développeurs
  • Par rapport aux outils en ligne de commande existants fondés sur des LLM, il propose une intégration plus simple et une grande facilité d’usage ; parmi les cas d’usage mentionnés figurent la correction d’erreurs de code, l’automatisation de la documentation de développement et l’analyse de données
  • Gemini CLI contribue à améliorer la productivité grâce à un accès rapide à l’IA, une utilisation en temps réel et une structure pouvant s’intégrer naturellement à l’environnement des développeurs

1 commentaires

 
GN⁺ 2025-06-26
Réactions sur Hacker News
  • La fragmentation extrême des produits Gemini de Google crée une vraie confusion. Bien que je sois abonné Pro, je ne découvre que maintenant que "Gemini Code Assist Standard" ou "Enterprise" offrent davantage d’usage. En tant qu’utilisateur Google lambda qui ignorait ces différences de forfaits et de fonctionnalités, je me retrouve dans la situation absurde de payer un abonnement Gemini à Google sans en tirer de réel avantage dans "Gemini CLI"

    • Google a aussi des produits dans presque tous les domaines, comme Microsoft, mais à cause d’un messaging confus, les avantages de chacun semblent dilués. J’aime moi aussi Gemini 2.5 Pro, mais j’ai essayé plusieurs produits IA pendant un moment pour trouver un assistant de chat IA au quotidien. L’abonnement Gemini Pro est inclus dans Google One et pratique avec Google Drive, mais je n’ai aucune raison de basculer à cause de mon abonnement iCloud existant et de l’intégration des données pensée pour l’environnement iOS. L’interface de chat Gemini est très en retard par rapport au client macOS d’OpenAI ChatGPT. NotebookLM est bon pour résumer des documents, mais comme il n’est pas intégré au chat Gemini, il faut sans cesse naviguer entre les produits Google. Au final, je paie un abonnement à Raycast AI, parce qu’il offre une expérience intégrée qui s’insère bien dans mon workflow et permet d’essayer divers modèles. Les tout derniers modèles n’y arrivent pas immédiatement, mais je suis satisfait de la cohérence d’usage. À force d’être dispersé sur de nombreux produits, Google se retrouve derrière OpenAI (travail généraliste) et Anthropic (codage) sur le plan de l’utilisabilité. Ces derniers mois, Google a tenté de rattraper son retard avec Google Stitch, des plugins VSCode pour GH Copilot/Cursor, Claude Code, etc., mais tout cela donne l’impression de side projects qui pourraient disparaître rapidement

    • La qualité est très élevée, mais le Google Cloud Dashboard est complexe, si bien que la plupart des startups et développeurs individuels choisissent autre chose que Google. J’héberge des modèles sur Vertex, mais la différence avec Google Cloud n’est pas claire. Il y a même deux API selon le niveau du projet. Un fournisseur d’IA devrait permettre un usage sans barrière d’entrée, quelle que soit l’échelle, mais chez Google on commence avec l’API Google AI Studio puis, si le projet grandit, on est forcé de migrer vers l’API Vertex : une solution d’API peu évolutive dans sa conception. L’API compatible OpenAI fonctionne souvent mal, si bien que plusieurs outils qui l’utilisent ne marchent pas correctement. Entre la gamme Google AI, c’est-à-dire la distinction entre Jules et Gemini CLI, la différence entre l’API Vertex et l’API AI Studio, et le fait que Vertex soit dépendant de Google Cloud avec toute la complexité de configuration des variables d’environnement lors du développement d’une app, il existe une vraie barrière à l’entrée liée à cette complexité documentation officielle des variables d’environnement Vertex

    • La politique tarifaire de Google est difficile à comprendre. J’irais jusqu’à dire que Gemini 2.5 Pro est le meilleur modèle que j’ai utilisé, mais il n’existe pas d’abonnement simple permettant d’accéder à toutes les fonctionnalités d’un coup, comme chez Claude ou Cursor. Côté utilisateurs enterprise, OpenAI a complètement verrouillé le marché

    • Il existe aussi un abonnement AI ULTRA à 300 dollars par mois. Même les avantages supplémentaires donnés par l’abonnement Google One semblent changer en permanence, donc il est difficile d’obtenir une explication claire

    • Anthropic, c’est pareil. Avec un abonnement, on peut utiliser Claude, mais Claude Code est facturé séparément en tant que "usage API", donc avec une grille tarifaire dissociée de l’abonnement. On dirait que quelqu’un a compris que nous préférons le CLI et a appris à nous le facturer à part. Il est possible de contourner via une GUI, mais la navigation y est moins intuitive que dans un terminal, ce qui est pénible

  • Je fais partie de l’équipe qui travaille sur ce projet. La courbe d’adoption est actuellement très raide, et en des jours comme aujourd’hui où les TPU tournent à plein régime, nous lisons avec attention les retours de tout le monde. Les signalements de bugs comme les demandes de fonctionnalités sont toujours les bienvenus

    • Hier après-midi, j’essayais de convertir en vanilla JavaScript un algorithme écrit en Ruby, un langage que je ne connais pas. J’ai essayé avec GPT-4.1, mais ça m’a juste fait perdre du temps sans aboutir. Par curiosité, j’ai installé Gemini CLI, pointé le projet Ruby, et en une seule requête la conversion a réussi très vite. J’étais stupéfait que tout le processus soit terminé en 5 minutes

    • J’ai un compte organisationnel payant Google Workspace with Gemini, et j’obtiens le message GOOGLE_CLOUD_PROJECT 환경변수 없음. Comme je n’utilise pas GCP, il n’est pas intuitif de savoir comment récupérer la valeur de cette variable d’environnement sans explication supplémentaire. Le fait que l’accessibilité soit pire pour les utilisateurs payants que pour les utilisateurs Google classiques montre que la documentation doit être améliorée

    • J’ai réussi à intégrer le code généré par Gemini CLI dans Apple Container sur M1. Explication de la manière d’appliquer les options Gemini CLI dans CodeRunner

    • J’espère la sortie d’un abonnement plus orienté grand public, par exemple à la Claude Max, combinant Gemini CLI et l’app Gemini, avec conformité IP et accès API inclus

    • Il y a trop de produits Google aux fonctions similaires, comme Google Gemini, Gemini Ultra, AI Studio, Vertex AI, Notebook LLM, Jules, etc., ce qui crée de la confusion dans l’accompagnement utilisateur et dans le système de licences

  • J’ai obtenu des résultats corrects avec Claude Code (4 Opus) sur une grosse codebase Rust, mais il montre ses limites sur les tâches complexes. J’ai aussi essayé Gemini CLI aujourd’hui : l’installation était facile, mais le résultat a été désastreux. Pour la réussite de compilation après modification de code Rust, c’était clairement inférieur à Claude. En revanche, le fait que Gemini laisse un message du genre "j’ai mis le code dans un état catastrophique, je vais annuler tous les changements et repartir de zéro" m’a offert mon fou rire du jour

    • La manière dont Gemini échoue est presque amusante. Quand ses corrections de code ne fonctionnent pas, il sort des phrases très humaines du type "voilà qui est inattendu", puis déclare avec assurance "je pense que les tests vont passer !". Son caractère de base très sûr de lui et son usage excessif des points d’exclamation sautent aussi aux yeux. Il a sans doute appris à l’entraînement que formuler les résultats de manière affirmative produisait de meilleurs retours

    • Hypothèse : Gemini profite d’un entraînement sur l’immense codebase interne de Google, mais comme l’usage de Rust chez Google reste limité, notamment grâce à de bons outils C++, Gemini serait relativement plus faible sur Rust

    • Expérience similaire ici. Je testais une nouvelle fonctionnalité d’app et tout s’est complètement emmêlé. Utilisation de fonctions non définies, répétition de plusieurs erreurs, puis abandon. Claude s’en est sorti correctement mais avec une qualité de code médiocre, tandis que Gemini avait des idées intéressantes au cas par cas mais manquait de cohérence et n’a pas réussi à finaliser

    • J’ai essayé aussi, et au bout de 15 minutes j’ai reçu exactement la même réaction de type "tout remettre à l’état initial"

    • Claude aussi tente parfois de revenir à l’état de départ quand la situation devient trop mauvaise. On le voit quand ses éditions internes deviennent incohérentes

  • Si l’on utilise Gemini Code Assist, toutes les données de mon code sont envoyées à Google (annonce lien) : prompts, code associé, résultats, retours d’usage, informations sur l’utilisation des fonctionnalités, etc. Toutes ces données sont collectées pour améliorer les services Google et le machine learning. Pour améliorer la qualité, des humains peuvent consulter, annoter et traiter directement ces données. Elles sont dissociées des informations de compte à des fins de protection de la vie privée puis conservées jusqu’à 18 mois. Il est recommandé de ne pas saisir d’informations sensibles ou de données que l’on ne souhaite pas exposer à l’extérieur

    • C’est en réalité un peu plus complexe. La version gratuite de Code Assist exploite par défaut les données collectées, mais un opt-out est possible via une procédure distincte information séparée. La version payante de Code Assist n’utilise pas les données pour améliorer le modèle. De même, si l’on utilise une clé API Gemini d’un compte pay as you go, les données ne sont pas non plus collectées à cette fin. L’étendue réelle d’utilisation des données sensibles est donc un peu moins sévère que ne le laisse entendre le message d’origine

    • Je comprends bien la remarque selon laquelle la politique de confidentialité semble floue selon la manière dont l’équipe se connecte à Gemini CLI. Pour dissiper la controverse, une documentation et une FAQ récapitulant clairement, par type de compte, les conditions d’utilisation du service et les politiques de données ont été ajoutées (lien vers la documentation)

    • Ce qui est le plus frustrant dans l’écosystème Gemini, c’est précisément le manque de transparence de la politique de confidentialité. Même si 2.5 pro est le meilleur modèle et que j’aimerais l’utiliser au travail, les conditions de confidentialité sont tellement confuses que je pars du principe qu’en pratique je ne bénéficie d’aucune protection. Et c’est pareil alors même que je suis abonné au niveau le plus cher

    • Mozilla et Google ont lancé une alternative appelée Gemmafile. Gemma est une version de Gemini entièrement hors ligne (open-airgapped) qui tourne localement dans un seul fichier, avec exécution autonome sans dépendances. Téléchargement 32 % des organisations l’auraient réellement déployée en 2025 (rapport)

    • La documentation configuration.md de Gemini CLI précise, dans la section "informations non collectées", que les informations personnellement identifiables, le contenu des prompts et réponses, ainsi que le contenu des fichiers, ne sont pas enregistrés dans les logs

  • Le prompt système de Gemini CLI est publié via ce lien Gist. Les notes personnelles associées sont ici

    • Gemini CLI est open source, donc on peut également consulter le texte source du prompt système dans le dépôt GitHub

    • Le prompt système indique qu’il faut utiliser uniquement des chemins absolus, mais l’exemple de fichier temporaire emploie un chemin relatif

  • Il y a quelques jours, j’écrivais avec Claude Code une petite web app de suivi boursier en Python avec streamlit, en suivant le flux du code ; jusqu’à une certaine taille de projet, cela marchait très bien, mais après ce point il n’arrivait plus à corriger rapidement les bugs. J’ai tenté la même chose avec Gemini CLI, et au moment où Claude Code commençait à se perdre, une demande du type "analyse la codebase et corrige tous les bugs" a d’abord permis de lancer l’app avec succès. Impression très nette de vivre le futur

    • Je me demande si c’est dû à la différence de taille de context window. La fenêtre de Gemini est 5 fois plus grande que celle de Claude. Avec Claude, au bout d’un moment pendant le débogage, ça se dérègle à cause d’un manque de contexte. Je testerai plus tard cela dans l’environnement à grande fenêtre de Gemini

    • Aujourd’hui, la bonne manière d’utiliser Claude Code consiste à confier les traitements lourds à Gemini 2.5 Pro ou o3/o3pro, et grâce au support MCP il est possible de relier les deux modèles de manière fluide. Si Gemini CLI est lui aussi open source, divers plugins de modèles semblent possibles. Dans un futur où les LLM seront commoditisés, des outils de type agent CLI pourraient devenir plus centraux que des wrappers UI. OpenAI a peut-être gagné la bataille du nombre d’utilisateurs, mais comme interface de travail réelle, ChatGPT est en retrait

    • Si l’on prépare pour chaque module un document markdown de synthèse de moins de 100 lignes contenant uniquement un aperçu du module et l’emplacement des fichiers, afin que l’IA puisse explorer ce contenu, cela aide à comprendre le contexte. Si c’est trop difficile à résumer sous cette forme, cela signifie probablement qu’un développeur humain aurait lui aussi du mal à le gérer. Bien transmettre le contexte essentiel à l’IA est important

    • Une ingénierie de prompt spécifique et claire serait probablement bien plus productive. Une demande du type "corrige tous les bugs" correspond assez mal à un scénario réaliste

    • Cette approche s’effondre à mesure que la complexité augmente, avec probablement beaucoup de code dupliqué et une très mauvaise efficacité mémoire. Au final, écrire directement soi-même pourrait être plus efficace. Je me demande même si la prolifération de code bricolé ne fera pas exploser anormalement la demande en DRAM

  • J’ai moi-même ajouté à Gemini CLI une interface vocale bidirectionnelle.

  • J’aurais préféré un binaire unique en Go ou en Rust, sans runtime nécessaire. Le fait qu’un runtime Node soit requis est regrettable

    • Pour ce genre de projet qui a besoin de mises à jour fréquentes, une gestion via npm ou pip est plus réaliste. Ce n’est ni un programme extrêmement gourmand en calcul, ni un outil aux besoins de stockage énormes, donc sur du matériel moderne cela ne pose pas vraiment problème. Je pense aussi que Go conviendrait très bien à cet usage, mais du point de vue pratique, la gestion des bibliothèques est plus simple ainsi

    • Il existe aussi un moyen de demander dans le prompt à Gemini CLI de le réécrire dans le langage de son choix

    • Ce projet donne plus l’impression d’un produit marketing pour pouvoir dire "nous aussi, on a un outil CLI" que d’un projet axé sur la qualité du produit

    • OpenAI serait d’ailleurs en train de réécrire Codex CLI en Rust plutôt qu’en Typescript, selon cet article référence. Je n’ai pas énormément d’expérience avec Node, mais l’installation, le packaging et l’isolation me semblent extrêmement bien aboutis

    • Il sera peut-être possible de produire un exécutable standalone avec Bun ou Deno. Explication du bundler Bun Explication de la compilation du CLI Deno. Si c’est du code Node standard, cela devrait au minimum bien fonctionner avec Bun. Je me demande quelle serait la différence de taille d’exécutable par rapport à Go ou Rust

  • "Failed to login. Ensure your Google account is not a Workspace account." Je me demande si l’architecture est telle qu’on ne peut pas utiliser un compte Workspace. J’ai un compte Workspace depuis l’époque GSuite, et j’ai l’impression de me heurter sans cesse à des restrictions dans les services Google. Au départ, je voulais juste un domaine personnalisé pour Gmail, mais j’ai aussi perdu l’accès à des données YouTube, des données Fitbit, etc., et même le choix des services d’abonnement reste inutilement bloqué. Au final, être empêché d’utiliser Gemini CLI pour du développement logiciel à cause d’un compte Workspace donne l’impression d’un manque de considération envers les clients fidèles de longue date, ce qui est décevant

  • Je l’utilise depuis environ un mois, et entre les performances SOTA de 2.5pro et le support du context window à 1M, c’est supérieur à la plupart des outils. Même en lui donnant une grosse codebase, il l’analyse et la parcourt rapidement et avec précision

    • Quand je l’ai utilisé dans Cursor, j’ai eu un problème où les imports de gros fichiers Python se cassaient. Je n’ai jamais eu ce souci avec Claude. Curieux de savoir si d’autres ont rencontré des problèmes particuliers avec Gemini

    • Curieux de connaître ton workflow