5 points par GN⁺ 2025-08-09 | 1 commentaires | Partager sur WhatsApp
  • Google a annoncé Gemini CLI GitHub Actions, basé sur Gemini CLI, pour faciliter la collaboration en équipe dans les dépôts GitHub.
    • Gemini CLI est un agent IA open source qui permet d'exploiter des capacités IA depuis le terminal.
    • Cette version GitHub Actions est pensée pour un environnement de collaboration en équipe : on peut l'envisager comme un collègue IA qui réside dans le repo.
  • Cet outil est proposé gratuitement en open source et est actuellement disponible en version bêta dans le monde entier.
  • Il s'exécute automatiquement de manière asynchrone selon les événements du dépôt GitHub (création d'une nouvelle issue, d'une PR, etc.), en traitant les tâches en comprenant le contexte global du projet.
  • Il offre 3 workflows open source puissants
    • Triage intelligent des issues (Intelligent issue triage)
      • Analyse les nouvelles issues et les étiquette ainsi que les priorise automatiquement
      • Aide les développeurs à se concentrer sur les tâches importantes
    • Revue accélérée des pull requests (Accelerated pull request reviews)
      • Fournit un feedback immédiat et approfondi sur les modifications de code
      • Vérifie la qualité, le style et l'exactitude du code pour réduire la charge des reviewers
    • Collaboration à la demande (On-demand collaboration)
      • Il est possible de déléguer des tâches depuis une issue ou une PR en mentionnant @gemini-cli
      • Exemple : « Rédiger des tests pour ce bug », « Implémenter la suggestion ci-dessus », « Brainstormer des solutions alternatives », « Corriger un bug clairement défini »
  • Considérez ces workflows comme un launchpad : puisque c'est open source, vous pouvez créer vos propres workflows.
  • En automatisant les tâches répétitives et chronophages, il améliore la productivité de développement, augmente l'efficacité de la revue de code et de la gestion des issues, et permet d'accélérer la collaboration en équipe.

1 commentaires

 
GN⁺ 2025-08-09
Avis de Hacker News
  • C’est une situation confuse où on ne sait pas s’il s’agit d’un CLI, d’une GitHub Action ou d’une GitHub Application. Jules était à l’origine qualifié d’« agent de coding », mais il n’est pas clair qu’un autre outil remplace désormais ce rôle, ou qu’il s’agisse d’un cas d’auto-concurrence de Google. J’ai l’impression que Google devrait avoir un leadership avec une vision plus claire. J’ai écrit du code Android pendant 13 ans, j’ai collaboré avec Google, joué un rôle de leader dans la communauté et les conférences des développeurs Google, échangé avec de nombreux GDE, et je suis dans la position d’utiliser l’API Gemini dans des produits, pourtant je ne comprends toujours pas ce que c’est. Côté client ordinaire, c’est quasiment incompréhensible. Il y a déjà deux SDK pour connecter l’API Gemini, et toute la documentation est dispersée ; pour une fonction précise, il faut googler puis fouiller les dépôts de code. La plupart des fonctionnalités que je souhaite sont soumises à une limitation de taux de requêtes ou réservées aux testeurs privés. Il y a trois coding agents. On a l’accès au compte Google et au téléphone, mais l’app Gemini est inutile. Même une tâche de base comme ajouter un compte de service dans Google Cloud est rendue difficile par une UX confuse. L’unique chose qui en vaille vraiment l’usage est AI Studio. Il permet d’expérimenter différents modèles, et l’UX de création de clé API Gemini s’est améliorée. Honnêtement, il est difficile de saluer ce lancement comme une réussite : c’est juste un nouveau produit « moyen ».

    • Il faut une frontière claire entre culture de recherche et culture logicielle. Dans un contexte de recherche, c’est souvent positif que plusieurs équipes fassent en même temps des expériences variées, mais les produits logiciels destinés aux clients demandent une autre approche.

    • Google a mis en place plusieurs espaces de type incubation ; certains qui réussissent ne s’intègrent pas naturellement avec les produits existants et semblent provoquer de la confusion chez les utilisateurs. L’exemple de NotebookLLM existe aussi. Mais je pense personnellement qu’autant d’expérimentations sont meilleures. L’équipe NotebookLLM semblait aussi fonctionner dans une ambiance d’autonomie.

    • Le point le plus drôle est qu’on ait accès aux données du compte Google et du téléphone alors que l’app Gemini ne sert à rien. L’app s’ouvre avec « Hello, Vasco », mais si on demande « Quel est mon nom ? », elle répond « impossible de connaître les informations utilisateur ». Je sais pourquoi, mais c’est une situation franchement cocasse.

    • Jules s’exécute de façon asynchrone, dans une VM, sur un checkout séparé du code. Gemini CLI fonctionne de manière synchrone en local avec l’utilisateur (sauf en mode YOLO). Les deux approches sont totalement différentes.

    • Avec Google Workspace, la donne change. Activer Gemini CLI à l’échelle d’une organisation entière est une expérience à la fois gratifiante et pénible. Explication détaillée

  • Je comprends que Google ait besoin de rester compétitif sur l’IA de coding, mais il y a beaucoup d’étrangetés.

    • Gemini ne peut même pas gérer une réservation de calendrier pour une réunion.

    • Dans Google Docs, la modification collaborative ne fonctionne pas et seules les insertions sont possibles.

    • Il n’y a pas de point de gestion central (MCP) pour Docs et Sheets.

    • L’aide sur les formules Sheets est même moins bonne que Google Search. Avec autant de domaines uniques, il est regrettable qu’il ne se démarque pas vraiment en IA. Anciennement, quand je cherchais la chaîne « remarkable » exact dans Gmail, j’obtenais aussi des mots associés comme « amazing ». La recherche sur tous les produits a régressé, c’est exaspérant.

    • En pratique, sur mon Android, j’ai vu un e-mail de réservation d’expédition ; en maintenant le bouton d’alimentation, Gemini s’est affiché. J’ai chargé le contexte de l’écran et dit « mets ceci dans mon calendrier », l’événement est ajouté. Ce n’est pas parfait (ex. ça peut sauter si l’événement couvre plusieurs jours ou si le lieu est bizarre), mais ça s’améliore progressivement. Si vous êtes client Google Workspace, l’intégration avec l’app web Gemini, Calendar et Drive est aussi prise en charge. Les tâches de résumé de documents, entre autres, sont possibles. Donc l’argument « impossible de créer un calendrier » n’est pas vraiment vrai.

    • Je pense que le fait que Google ne mette pas Gemini pleinement dans les docs ressemble à la raison pour laquelle Apple ne le déploie pas sur iPhone. La fiabilité n’est pas encore absolue : on n’est pas à un niveau 99,99 % à proposer au grand public. C’est un système que je recommande surtout aux early adopters, pas au grand public.

    • Il y a énormément d’usages quotidiens utiles, mais le marketing laisse à désirer. Par exemple, j’ai pris en photo une liste de courses et demandé à Gemini de la convertir au format collable, et il s’est contenté de la transférer tel quel dans Google Keep sans catégoriser. Si l’équipe priorise cela et l’affine un peu, ça serait bien plus utile. OpenAI marketingue beaucoup de fonctions sur TikTok, et les plus de 30 ans ignorent souvent même l’existence de Gemini. En pratique, Gemini me semble plus utile que ChatGPT, mais le marketing est quasi inexistant.

    • Le support de Google Docs est tellement limité que ça ne crée aucune attente.

    • La recherche semble ne pas fonctionner correctement parce qu’elle a été basculée uniquement sur les embeddings. En réalité, il faudrait un système de recherche hybride mêlant embeddings, correspondance textuelle et quality vectors pour bien faire, mais difficile à scaler rapidement. Si vous connaissez un tel système, ça m’intéresserait.

  • Comprendre ce qu’est réellement ce service demande énormément de temps. En retirant les slogans marketing, les explications verbeuses et les termes inutiles, son vrai visage apparaît. Selon moi, c’est une GitHub Action. C’est un wrapper à insérer dans un fichier YAML de workflow GitHub, qui exécute Gemini CLI et transmet le prompt, le contexte du repo, ainsi que des données d’événements comme les issues ou le diff de PR pour répondre ou exécuter des actions. Via un token ou une app, il est possible de lire/écrire des données de repo via l’API GitHub (ajout de labels, commentaires, propositions de code, etc.). Appels standards via l’endpoint HTTPS de l’API Gemini LLM.

    • Boris Cherny et Catherine Wu ont une vidéo dans le podcast Latent Space sur le linting sémantique des CLI IA. Entretien YouTube associé Je n’ai jamais vraiment utilisé de CLI IA en CI/CD, mais la logique de validation pass/fail sémantique m’intéresse beaucoup.

    • La doc dit « utilisez ça dans l’interface de chat », je me demande donc ce qu’est cette interface.

  • Les plans Gemini (ex. Google One, Workspace, etc.) s’appliquent seulement aux produits web, et pas aux solutions API (ex. Gemini CLI). Si un seul abonnement mensuel développeur débloquait CLI, GitHub Action, Gemini chat, Jules, etc., ce serait vraiment innovant. J’ai besoin d’un modèle de facturation unique, comme chez Claude.

    • Comprendre la structure des abonnements nécessiterait presque une IA.

    • Le tier gratuit de Gemini est vraiment confus. J’ai testé avec plusieurs agents : au bout de 5 à 6 requêtes, la limite de taux est atteinte. En revanche, l’app web donne l’impression d’un usage illimité. Ils disent qu’il y a un « quota gratuit généreux » pour essayer, mais ça bloque vite. C’est adapté aux tests simples, pas au travail réel.

  • Sur le texte des visuels de la présentation marketing : il est hilarant qu’en délégant une tâche avec le tag « @mini-cli », on dise que l’on peut gérer de la rédaction de bugs jusqu’à leur correction.

    • C’est surprenant que cette phrase ne soit toujours pas corrigée. Peut-être est-ce, au fond, une forme d’honnêteté brutale.
  • Je me demande si appeler ça « gemini cli » est vraiment correct. Si la plupart des usages passent par GitHub, ce n’est plus vraiment un CLI. Un nom plus intuitif, du type « gemini github action » ou « run gemini », comme Claude Code, serait sans doute préférable.

    • J’imagine que le nom vient du fait que l’équipe Gemini CLI a développé le truc, pour donner du crédit à l’équipe, ou pour éviter qu’il paraisse trop produit « grand public » sous pression interne.

    • En pratique, l’action est d’installer gemini-cli dans la VM GitHub Action puis de transmettre les commentaires d’issue/PR comme prompt à gemini-cli.

    • J’ai moi aussi eu les mêmes doutes sur le naming. C’est vraiment la partie la plus décevante.

    • C’est en fait un add-on à l’usage local de Gemini CLI.

  • L’an dernier, j’ai réellement développé une plateforme de bounty pour les PR GitHub. À cause des incentives, beaucoup de PR de faible qualité ont été soumises, et comme l’IA permet de créer des brouillons facilement, le concept est devenu en pratique sans objet. J’ai l’impression que les difficultés majeures de la gestion open source se sont déplacées vers la limitation des ressources du reviewer/main maintainer. C’est pourquoi j’expérimente un framework qui génère automatiquement des PR depuis les agents principaux pour optimiser les étapes de revue et d’approbation/correction. J’ai réuni des études de cas là-dessus

  • La mise en place requiert pas mal de configuration ; comparé à GitHub Copilot Agent, qui est facile d’accès pour tous les utilisateurs, l’argumentaire est nettement moins convaincant. Gemini assistant doit être nettement supérieur aux outils existants pour avoir une chance d’attirer des utilisateurs.

    • Si on parle d’un assistant « largement meilleur », je me demande ce qu’on entend par Claude. Gemini pourrait être aussi bon, à condition d’avoir un abonnement clair et raisonnable.
  • Le fait que ce soit vraiment gratuit est justement suspect. Les données d’entraînement peuvent en être le prix, et comme il n’y a pas d’option de refus (opt-out), je pense qu’il faut l’utiliser prudemment sur des dépôts personnels ou internes.

  • J’obtiens de très bons résultats avec Copilot Agent. Il m’arrive de fermer une PR et d’affiner une issue ou de travailler localement avec cursor, mais le démarrage des tâches est tellement plus rapide que la satisfaction reste globalement élevée.