GitHub Copilot : l’agent de codage lancé en preview publique

(github.blog)

11 points par GN⁺ 2025-05-20 | 2 commentaires | Partager sur WhatsApp

GitHub a ouvert en preview son agent de codage Copilot aux utilisateurs de Copilot Pro+ et Enterprise
Il permet aux développeurs de déléguer à Copilot des tâches répétitives et marquées par la dette technique afin de se concentrer sur des travaux plus créatifs et plus importants
En assignant une issue à l’IA, celle-ci peut automatiquement modifier le code, exécuter les tests et créer une PR
Une fois le travail terminé, Copilot demande une revue ; le développeur peut demander des changements supplémentaires en commentaire ou reprendre directement le travail sur la branche
Le travail s’effectue dans un environnement de développement cloud basé sur GitHub Actions, où les tests et les linters sont également vérifiés automatiquement
Les utilisateurs peuvent demander des modifications à Copilot via des commentaires dans la PR ou récupérer la branche en local pour collaborer
L’outil montre surtout ses points forts pour des tâches de complexité faible à intermédiaire comme l’ajout de fonctionnalités, la correction de bugs et le refactoring, notamment sur des codebases bien couvertes par des tests

GitHub Copilot coding agent in public preview

Réduire la dette technique et se concentrer sur des tâches plus créatives grâce à l’agent de code

GitHub a lancé l’agent de codage Copilot en preview publique, afin de permettre de déléguer à Copilot des issues répétitives ou simples
Les développeurs peuvent lui assigner une issue comme à n’importe quel autre développeur, avec une prise en charge sur le site web de GitHub, l’application mobile et le CLI
Copilot analyse le dépôt dans son propre environnement de développement cloud, applique les modifications, exécute les tests et les vérifications de lint, puis crée une PR
Une fois terminé, il demande à l’utilisateur de relire le travail ; il est aussi possible de donner un retour via des commentaires dans la PR ou de poursuivre directement sur la branche en local

Pour quels types de tâches

Copilot se montre particulièrement à l’aise pour des tâches de complexité faible à intermédiaire comme l’ajout de fonctionnalités, la correction de bugs, l’extension des tests, le refactoring et l’amélioration de la documentation
Il fonctionne efficacement sur des codebases bien couvertes par des tests, et il est aussi possible de lui assigner plusieurs issues en parallèle

Conditions d’utilisation et tarification

Cette fonctionnalité est disponible avec les offres Copilot Pro+ ou Copilot Enterprise
Dans le cas d’Enterprise, l’administrateur doit activer au préalable la politique « Copilot coding agent »
L’utilisation de l’agent consomme du temps GitHub Actions et des requêtes Copilot Premium
- En particulier, à partir du 4 juin 2025, une requête Premium sera facturée pour chaque requête de modèle

Prise en charge des plateformes et démarrage

La fonctionnalité est actuellement en cours de déploiement progressif pour les utilisateurs de GitHub Mobile (iOS/Android) et de GitHub CLI
La documentation de l’agent de codage Copilot explique comment démarrer et donne quelques conseils
Il est possible de partager des avis ou des questions dans la discussion communautaire

2 commentaires

wedding 2025-05-20

Je l’utilise sur VS Code Insiders, et comme ça s’améliore progressivement, c’est vraiment très pratique.
Ces derniers temps, il fait même du codage prédictif.

GN⁺ 2025-05-20

Avis Hacker News

J’ai l’impression que Copilot est efficace pour des tâches de difficulté faible à moyenne sur des bases de code bien testées, comme l’ajout de fonctionnalités, la correction de bugs, l’extension des tests, le refactoring ou l’amélioration de la documentation. Mais le point important pour les humains reste de garder un regard critique quand on utilise l’IA. Si les tests sont eux aussi générés uniquement par l’IA, il y a un risque qu’ils ne vérifient pas réellement le bon fonctionnement. J’aimerais entendre des chiffres précis sur le degré d’adoption et de succès en interne chez Microsoft. Microsoft est connu pour réellement utiliser ses propres produits en interne, mais j’ai le sentiment qu’il est très difficile de distinguer l’énorme marketing de l’utilité réelle
- Chez GitHub et Microsoft, nous utilisons en interne le Copilot coding agent depuis presque trois mois. Cette expérience a permis d’obtenir beaucoup de retours et de corriger des bugs, ce qui nous a permis de préparer le lancement de l’agent aujourd’hui. Jusqu’à présent, environ 400 employés de GitHub ont utilisé l’agent sur plus de 300 dépôts, et près de 1 000 PR auxquelles Copilot a contribué ont été fusionnées. Dans le dépôt où l’agent est développé, Copilot agent est le 5e contributeur le plus actif. Autrement dit, nous utilisons Copilot coding agent pour construire Copilot coding agent. (Je suis le responsable produit de Copilot coding agent chez GitHub)
- En interne chez Microsoft, cela donne l’impression d’un déploiement imposé de manière coercitive par le management. D’après un ami dans l’équipe Azure, quelqu’un a failli se retrouver dans un PIP (plan d’amélioration des performances) pour avoir refusé d’installer un assistant de code IA interne. Chaque manager fixe comme OKR le « nombre de développeurs utilisant l’IA », et beaucoup de développeurs se contentent de l’installer sans vraiment s’en servir. Il y a aussi une déception sur le fait que le support de C# et PowerShell reste insuffisant, ce qui limite fortement l’utilité réelle
- Microsoft a déjà publié des chiffres, notamment sur la proportion de code généré par l’IA. On parle de 30 % du code écrit par l’IA
- Dire que Microsoft était célèbre pour le dogfooding était vrai il y a 15 ans, mais plus du tout aujourd’hui
Je veux avertir que le fait que le code des dépôts privés puisse être utilisé pour l’entraînement est un très gros problème avec Copilot. Il existe des abonnements Pro et Pro+, mais la FAQ dit seulement que les données Business ou Enterprise ne sont pas utilisées pour l’entraînement, ce qui laisse entendre que les données des offres payantes individuelles le sont toujours
- C’était peut-être vrai avant, mais ce n’est plus le cas. On peut vérifier la politique actuelle des offres individuelles dans la documentation officielle de GitHub
- Si vous codez sous Windows, votre écran est probablement déjà capturé automatiquement toutes les quelques secondes, et tous les caractères affichés sont analysés par OCR. C’est une surprise pour ceux qui ne le savaient pas
J’ai fait une expérience de vibe coding sur un projet greenfield avec Gemini 2.5 pro et cline. C’était assez impressionnant, et bien plus productif qu’une interface de chat LLM classique. En revanche, si les consignes d’architecture ne sont pas assez strictes, le LLM a tendance à accumuler de mauvaises abstractions et de la dette technique, par exemple en détruisant la structure. Il ne fait pas beaucoup d’auto-évaluation sur la qualité du code ou sur l’existence de meilleures approches. L’avantage, c’est que si je lui signale clairement le problème dans un prompt, il corrige immédiatement. Et j’ai été surpris de voir 15 $ de coûts de tokens LLM en une seule soirée. En temps normal, je suis plutôt autour de 20 $ par mois, et c’est la première fois que je vois ça en une seule journée
- Dépenser 15 $ de tokens LLM par jour, ce n’est pas un bug, c’est une fonctionnalité. Je pense qu’on va bientôt voir un phénomène de type « facture AWS explosive » aussi avec les LLM
- Je recommande aussi d’essayer l’outil Aider et de gérer activement le contexte avec /add, /drop et /clear
- Si vous voulez utiliser Cline en faisant attention au coût, il faut vraiment gérer le contexte à la main. À la place, j’utilise Windsurf, toujours avec Gemini 2.5 pro. La gestion du contexte y est bien plus simple
- Sur un projet greenfield, utiliser l’IA peut être inconfortable. Il y a trop de choix possibles, donc l’IA hésite sans cesse entre différentes approches. Sur un projet brownfield, on peut fournir des fichiers de référence pour lui faire apprendre naturellement les patterns, et il est alors beaucoup plus facile d’obtenir de bons résultats
- Je m’intéresse à la prévention de la pollution architecturale par les LLM. J’espère que l’étape suivante sera l’apparition de linters (basés sur l’IA) capables de vérifier que l’implémentation respecte bien la définition de conception
Je pense qu’il faut optimiser la vitesse avant d’ajouter des fonctionnalités. L’autocomplétion de Copilot est rapide, mais il arrive que l’édition d’un fichier de 100 lignes prenne plusieurs minutes, ce qui donne une expérience improductive. Je comprendrais si le taux de réussite approchait les 100 %, mais attendre un outil lent qui hésite sans cesse est pénible. Au final, il est souvent plus rapide d’ouvrir un nouvel onglet avec Claude ou ChatGPT, puis de faire du copier-coller de questions et de code. J’ai annulé mon abonnement Copilot et je compte passer à des modèles locaux pour l’autocomplétion et les tâches simples
- Mon expérience est exactement inverse. L’édition de fichiers de plusieurs centaines de lignes se fait en quelques secondes. C’était peut-être lent avant, mais récemment les goulots d’étranglement semblent avoir disparu. Même sur le Wi-Fi d’une bibliothèque, Copilot reste très agréable à utiliser
- Si cela prend plusieurs minutes, je pense qu’il y a un problème sérieux. La plupart des modèles traitent cela en quelques secondes
Dans VS Code, j’alterne entre ChatGPT et Copilot. Comprendre la syntaxe d’Objective-C est devenu beaucoup plus facile. Le support des bibliothèques est encore insuffisant, mais je pense aussi ne pas avoir assez essayé avec les bibliothèques tierces. Les erreurs de syntaxe et de flux se repèrent immédiatement, donc après une petite correction, j’utilise souvent le code presque tel quel. Pour 10 $ par mois, cela me rend plutôt optimiste sur l’avenir. J’ai énormément d’apps iOS à mettre à jour, toutes des apps de productivité que j’utilise, développe et vends moi-même. Donc j’y gagne doublement
J’ai pas mal utilisé Copilot. C’est impressionnant, mais aussi un peu inquiétant. Le problème important, c’est qu’il recommande sans discernement des dépendances aléatoires issues de petits dépôts, et dans bien des cas elles sont inadaptées à des projets sérieux. Autrement dit, l’utilisateur doit rester vigilant
- J’ai observé des schémas similaires avec plusieurs IA. Elles accordent trop de confiance aux données lues sur le web. Par exemple, si on leur demande de vérifier une arnaque de phishing, elles se contentent souvent de résumer le contenu au lieu de fournir une analyse fiable. J’ai aussi vu des cas où elles recommandaient un dépôt chinois obscur avec deux étoiles comme s’il s’agissait d’un standard de l’industrie, simplement parce que c’était écrit dans le README. Ce n’est pas tout à fait le sujet, mais elles ont aussi recommandé le protocole de chiffrement « Strobe » en renvoyant vers strobe.cool, alors que ce site traite justement de contenus conçus pour provoquer des hallucinations
- Merci d’avoir mentionné ce phénomène. Je n’ai pas rencontré ce comportement pendant les tests, donc j’aimerais creuser davantage. Si vous pouvez me le partager par e-mail, ce serait utile (mon pseudo HN sur github.com). Je travaille dans l’équipe produit de Copilot coding agent
- L’exécution des PR dans les dépôts privés fonctionne avec un contexte plus fiable, mais même dans cette situation, ce genre de recommandation de dépendances reste préoccupant
La phrase « Copilot est fort sur les tâches de complexité faible à moyenne » m’a fait bonne impression. Mais le fait que cela soit limité à des bases de code bien testées fait retomber mon enthousiasme
- Comme l’a dit un autre commentaire, le coding agent excelle pour améliorer la couverture de tests. Et si on va un cran plus loin, les outils de codage agentiques sont encore beaucoup plus efficaces lorsqu’il existe déjà une bonne couverture de tests. Les tests permettent d’encadrer l’agent et de lui donner l’occasion de vérifier lui-même son travail de façon répétée. Ils ne sont pas absolument indispensables, mais quand ils sont là, les résultats sont meilleurs (je travaille dans l’équipe Copilot coding agent)
- Si on laisse Copilot écrire tous les tests, on obtient très vite une base de code bien testée
- D’après mon expérience, cela fonctionne plutôt bien même sans tests, surtout sur des projets greenfield. Mais l’effet sur les mises à jour et correctifs est clairement meilleur quand des tests existent déjà
À la formule publicitaire « Vous vous noyez dans la dette technique ? », quelqu’un a répondu en plaisantant qu’il valait mieux abandonner et couler. Il a lancé avec ironie que GitHub Copilot Coding Agent allait ajouter encore plus de dette technique, une nouvelle dette dont personne ne saurait vraiment qui est responsable, et que les collègues finiraient bientôt eux aussi dans la même situation
Un de mes amis participe au projet concerné chez GitHub, et cela fait plusieurs jours que je n’entends parler que de ça. Il m’a martelé qu’il fallait absolument regarder la keynote de lundi. J’ai abandonné le stream après le troisième timeout d’authentification, mais si j’avais su que c’était de ce sujet qu’il s’agissait, j’aurais probablement tenté encore une fois
- Je me demande de quelle keynote il s’agit précisément. Jusqu’ici, je ne trouve pas grand-chose en cherchant
- Un conseil : allez simplement sur YouTube pour éviter le parcours d’inscription MS
- J’écoute toujours avec prudence les retours des codeurs en poste, parce qu’il y a souvent beaucoup de marketing interne. J’espère que cela surpassera des concurrents comme Cursor, et j’ai bien l’intention de regarder la démo en direct
Aux débuts des LLM, j’avais créé moi-même un agent avec github actions et un workflow issues. Les fonctionnalités étaient limitées, mais il suffisait d’assigner un bug pour qu’il exécute automatiquement les actions, traite les tâches d’architecture et d’édition, vérifie les changements, puis envoie une PR à la fin. Maintenant qu’on va pouvoir utiliser quelque chose de similaire avec un outil officiel, cela m’enthousiasme (exemple de mon travail : chota)