- Kimi K2.7 Code est ajouté à GitHub Copilot et devient le premier modèle à poids ouverts pouvant être sélectionné dans le sélecteur de modèles
- Hébergé par GitHub sur Microsoft Azure, il offre davantage de choix de modèles et une option moins coûteuse pour les workflows de développement
- La facturation suit le modèle de tarification à l’usage selon le prix public du fournisseur ; pour le coût réel, il faut consulter la documentation sur les tarifs des modèles et des requêtes Copilot
- Le déploiement commence progressivement pour les offres Copilot Pro, Pro+ et Max, avec disponibilité dans le sélecteur de modèles de Visual Studio Code
- Dans Copilot Business et Enterprise, l’option est désactivée par défaut ; avant un usage en organisation, l’activation de la politique par l’administrateur et un examen de la sécurité, de la conformité et de la gouvernance des données sont nécessaires
Premier modèle à poids ouverts ajouté à Copilot
- Kimi K2.7 Code est un modèle à poids ouverts désormais proposé officiellement dans GitHub Copilot
- Il devient le premier modèle à poids ouverts disponible dans le sélecteur de modèles de Copilot
- Il apporte davantage de choix de modèles et une option plus économique dans les workflows de développement
- GitHub héberge le modèle sur Microsoft Azure
Facturation à l’usage
- Kimi K2.7 Code est facturé à l’usage sur la base du prix public du fournisseur
- Les détails de facturation sont disponibles dans GitHub Copilot’s pricing for models and requests
Portée de la disponibilité dans Copilot
- Kimi K2.7 Code est d’abord déployé progressivement pour les offres Copilot Pro, Pro+ et Max
- Les utilisateurs peuvent sélectionner ce modèle dans le sélecteur de modèles de Visual Studio Code
- Le déploiement se fait par étapes et GitHub continue de surveiller la qualité et les performances du modèle
- L’accès sera étendu dans les prochaines semaines à Copilot Business, Enterprise et à des écrans d’utilisation supplémentaires
Clients et interfaces pris en charge
- Le sélecteur de modèles est disponible dans les environnements suivants
- Visual Studio Code 1.127.0 ou version ultérieure
- Visual Studio 17.14.6 ou version ultérieure
- Copilot CLI
- GitHub Copilot cloud agent
- GitHub Copilot App
- github.com
- GitHub Mobile iOS et Android
- JetBrains 1.9.1-251 ou version ultérieure
- Xcode
- Eclipse
Paramètres administrateur pour Business et Enterprise
- Kimi K2.7 Code est désactivé par défaut dans Copilot Business et Copilot Enterprise
- Pour que les membres d’une organisation puissent choisir ce modèle, l’administrateur de l’offre doit activer la politique Kimi K2.7 Code dans les paramètres Copilot
- Tant que cette politique reste désactivée, le modèle ne peut pas être utilisé dans l’organisation concernée
- Avant l’activation, il est recommandé aux administrateurs de vérifier qu’un modèle à poids ouverts répond à leurs exigences en matière de sécurité, de conformité et de gouvernance des données
Documentation et canal de retour
- La liste complète des modèles disponibles dans GitHub Copilot figure dans la documentation supported models
- Pour choisir le modèle adapté à une tâche, voir choosing the right AI model for your task
- Les retours peuvent être partagés dans la discussion GitHub Community
1 commentaires
Avis sur Hacker News
Les produits d’IA basés sur le cloud ne m’intéressent presque plus désormais
Je suis lassé d’avoir vu trop souvent des fonctionnalités et workflows prometteurs que j’attendais devenir difficiles à utiliser pour toutes sortes de raisons : hausses de prix, impression de baisse des performances, arrêts de service, remplacements, etc.
J’ai monté une petite machine et je me suis quasiment installé sur Qwen3.6 ; j’ajoute lentement moi-même les fonctionnalités dont j’ai besoin. Je ne sais pas si c’est au niveau de Claude, et j’ai arrêté de vérifier. Ça m’apporte déjà beaucoup de valeur, ça continue de s’améliorer, et même si l’herbe est peut-être plus verte ailleurs, j’aime le fait qu’elle ne change pas sous mes pieds
Pour ceux qui n’ont pas assez de mémoire pour faire tourner de gros modèles autour de 32 Go, je veux signaler que les modèles élagués offrent aussi de très bonnes performances. Sur une petite machine, le modèle quantifié Q4 pruned unsloth de GLM 4.7 Flash, qui tient dans 14 Go, vaut le coup d’être essayé : https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
D’habitude j’utilise LM Studio pour ce genre d’usage, mais unsloth propose aussi sa propre application Studio, qui peut être mieux adaptée à ce type de modèles quantifiés. J’ai utilisé GLM 4.7 Flash comme modèle principal pendant quelques mois : il était très tenace et très rapide, et me semble être un bon choix sur du matériel limité
Par exemple, le nouveau Claude est ajusté pour le codage agentique, ce qui peut même être nuisible pour du codage non agentique ; Fable 5 a l’air bon, mais son coût d’inférence est élevé et il y a de fortes chances de voir arriver une baisse de performances, des limites ou une refonte tarifaire après sa sortie. Gemini 3.5 a des limites plus généreuses, mais ses performances sont un peu inférieures
Les nouvelles versions sortent et les numéros montent, mais je me demande si tous ces changements sont vraiment des avancées, ou simplement un tuning différent avec des performances par dollar similaires à celles du début de l’année. Les vrais changements se voient davantage dans de petits modèles comme Qwen ou Gemma 4 31B, et c’est assez magique, surtout en tenant compte des capacités multilingues
Juste après avoir posté, j’ai vu une comparaison avant/après de Fable : la version réintroduite est encore en train d’être retouchée, et ses performances sur BridgeBench se sont effondrées de façon catastrophique : https://x.com/Hesamation/status/2072692225100612032
Ce n’est pas aussi rapide que le Claude que j’utilise au travail, mais ça tourne suffisamment bien en local, et je n’ai pas à m’inquiéter de voir des crédits ou des fonctionnalités disparaître soudainement
J’aime beaucoup Copilot CLI. Je le trouve plus logique et avec moins de friction que Claude Code
J’aime aussi pouvoir alterner librement entre plusieurs modèles. Par exemple : « faire le plan avec Opus 4.6, le faire vérifier par GPT 5.4 et récupérer ses retours, puis implémenter avec Sonnet 4.6 »
Mais à cause du changement de tarification de Copilot en juin, j’ai dû passer à Claude Code, à titre personnel comme pour tout le département de mon entreprise. En avril-mai, on dépassait légèrement les crédits inclus et on payait quelques dollars de plus ; à partir de juin, on épuisait le budget mensuel tous les 2 ou 3 jours
Du point de vue client, c’est une hausse de prix complètement folle, et je ne sais pas à quoi pensait Microsoft. Même si ce tarif était nécessaire pour la viabilité du service, ils auraient dû attendre que les concurrents changent leurs prix d’abord. Je ne serais pas surpris qu’ils aient perdu plus de 50 % des clients Copilot le mois dernier
Si, au final, tous les grands acteurs s’alignent sur ce niveau de prix, il faudra peut-être que l’État exploite une IA d’accès public, comme pour la télévision. Utiliser des modèles ouverts gratuits, faire tourner quelques data centers financés par l’impôt, avec des restrictions régionales et un throttling strict, mais en laissant les étudiants et les citoyens s’en servir librement
Si dans quelques années tous les prix de l’IA atteignent le niveau de Copilot, seules les licornes pourront l’utiliser, et les autres n’auront plus aucune chance de rivaliser avec les entreprises qui utilisent l’IA
C’est littéralement une répercussion des coûts : https://platform.claude.com/docs/en/about-claude/pricing
Anthropic propose aussi un abonnement, mais les entreprises ne veulent généralement pas l’utiliser. Parce que ce qui est soumis par ce canal peut être utilisé pour l’entraînement ou devenir une partie du modèle
L’utiliser sans l’autorisation explicite de l’employeur peut constituer une violation de contrat et, en cas de procès, les conséquences peuvent être graves
En parallèle, on teste AWS Bedrock et Deepinfra pour des modèles à poids ouverts, au cas où Claude Code finirait par ne plus être une bonne affaire une fois aligné sur les vrais coûts en tokens
Claude est largement en avance côté outils, mais la définition du modèle par sous-agent et l’accès à tous les modèles valent mieux que toutes les fonctionnalités que Claude propose actuellement réunies
Dans mon entreprise, la seule limite à la quantité d’IA qu’on peut consommer par mois, ce sont les dollars ; donc ce qui réduit les coûts est, pour moi, le meilleur modèle et le meilleur environnement d’exécution. Copilot se débrouillait aussi mieux pour attribuer automatiquement aux sous-agents des modèles plus appropriés, tandis que Claude utilise souvent des modèles plus chers
Cela dit, il existe des modèles efficaces capables d’exécuter un plan produit par un meilleur modèle. Quand on pense que la sélection automatique de modèles de Microsoft, dans son ancien modèle tarifaire déficitaire, choisissait des modèles de raisonnement de pointe pour des tâches comme résoudre des conflits de dépendances, c’est un peu gênant
J’utilisais GitHub Copilot pour le développement de VS 2026, en alternant avec ChatGPT et Claude, et c’était avant que je découvre Claude Code et l’app Codex
Copilot me convenait pour mon usage, et 10 dollars par mois suffisaient
Mais quand le nouveau modèle tarifaire a été introduit le mois dernier, les 10 dollars ont été épuisés en quelques jours. Je sais que l’ancien tarif n’était pas tenable, mais cela m’a fait passer à Claude Code et Codex, et je n’ai pas eu à regarder en arrière. Les tokens de Claude Code et de Codex sont eux aussi vendus à un prix largement subventionné, mais autant en profiter tant que ça dure
On sent une différence entre utiliser Claude via Copilot et utiliser Claude directement dans Claude Code. Je ne sais pas ce que Microsoft fait en arrière-plan
Anthropic a une petite longueur d’avance à la fois sur l’environnement d’exécution et sur le modèle, ce qui lui donne le meilleur des deux mondes
Côté Microsoft, c’est sans doute le même modèle, mais les outils et prompts autour semblent moins bons, et les résultats le sont donc aussi
J’utilise maintenant l’environnement d’exécution reasonix pour DeepSeek, et en cas de hit de cache, le coût est presque nul. Même en utilisant des fournisseurs américains non subventionnés comme Digital Ocean ou Cloudflare
Le langage cible est C++, et ça ne pose aucun problème
J’aime bien utiliser Claude dans VS Code via Copilot, et j’ai l’impression que cela donne un meilleur code, car on contrôle mieux la qualité du code. C’est beaucoup plus transparent que Claude Code, c’est open source, et l’interface de l’IDE offre davantage de contrôle sur le contexte et les artefacts générés
La hausse des coûts n’est pas uniquement due à l’augmentation des prix : les agents du modèle Opus consomment aussi davantage de tokens. Je suis donc passé à Claude Code et j’utilise toujours Opus 4.6 avec satisfaction. Fable et 4.7 ont tendance à s’égarer et à inventer des hypothèses sur des tâches de plus grande ampleur, ce qui rend les résultats brouillons
Enfin une alternative d’un grand fournisseur utilisable par les entreprises est arrivée
Les gens voulaient un moyen d’exécuter des modèles chinois chez un fournisseur de confiance, et GitHub le propose
Si l’on croit les benchmarks, les performances sont au niveau de Sonnet 4.6. Reste à voir si cela vaut le coup aux tarifs de GitHub
GPT-5.4 valait 1x pour les abonnés annuels, mais vaut maintenant 6x. Les requêtes premium s’épuisent en quelques prompts. GitHub Copilot à 10 dollars par mois était auparavant le meilleur rapport qualité-prix pour utiliser à bas coût les modèles des labos d’IA américains
Il a tourné autour du pot là où Claude aurait terminé en une seule fois. Cela dit, mon chemin d’accès passait par Ollama Cloud, et je ne sais pas s’ils fournissaient le vrai modèle ou une version quantifiée ; la quantification a peut-être dégradé les performances
La bonne nouvelle, malgré tout, c’est qu’un précédent est créé. Si Microsoft propose maintenant Kimi K2.7, il pourrait bientôt proposer GLM 5.2, qui est réellement un modèle très compétitif
Synthetic exploite ses propres modèles à des tarifs raisonnables, dont GLM5.2 et Kimi K2.7-Code
Lien de parrainage : https://synthetic.new/?referral=kwjqga9QYoUgpZV
Entrée : 0,95 dollar, hit de cache : 0,19 dollar, sortie : 4,00 dollars
C’est le même prix que celui facturé par Moonshot, et à peu près dans la gamme de prix de GPT 5.4 mini, donc ce n’est pas une mauvaise option
Exemple de prompt idiot qui gaspille des tokens pour le contexte : « Joue tout seul au morpion sur un plateau 5x5. Tu gagnes si tu alignes 5 symboles. »
Avec Kimi K2.7, cela coûte 0,006 dollar et on peut voir toute la trace brute du raisonnement. GPT-5.4 mini coûte 0,016 dollar et c’est résumé
Si vous vous posez la question, les deux jouent de manière incroyablement stupide
Kimi :
A B C D E
1 . . . . .
2 . . . . .
3 X X X X X
4 . O O O O
5 . . . . .
GPT 5.4 mini :
1: X X X X X
2: O O . . .
3: . . O . .
4: . . . O .
5: . . . . O
Pour info, pour ceux que ça intéresse, GPT 5.5 joue le même coup nul que 5.4 mini, mais coûte 4 fois plus cher
Fable produit une partie plausible pour 40 cents
X X O O O
O O X X X
X X X O O
X O O X O
X O X X O
Bonne idée. J’ai demandé la même chose à Haiku dans Claude Chat sur iOS : il a créé un jeu React interactif, implémenté les règles, puis m’a laissé jouer moi-même
À 1 dollar en entrée et 5 dollars en sortie, joli coup, Anthropic !
Les grands modèles de langage sont faibles aux jeux, mais ils sont tout à fait capables d’écrire un agent d’apprentissage par renforcement qui apprend le jeu lui-même
Si je m’ennuie vraiment, je pense faire jouer deux modèles aux échecs l’un contre l’autre
Il doit déjà exister quelque part un benchmark d’échecs ou un tournoi de grands modèles de langage
Il est étrange qu’AWS Bedrock prenne en charge ce type de modèles de manière aussi limitée
Il n’y a que Kimi 2.5, qwen 3 coder, DeepSeek V3.2, GLM 5 environ, et aucun modèle récent
Les instances Inf2 nécessitent AWS Neuron [1]. Il est aussi possible que porter les modèles pour qu’ils tournent sur ce matériel prenne beaucoup trop de temps
[1] https://aws.amazon.com/ai/machine-learning/neuron/
Le coût d’exécution est clairement beaucoup plus bas que celui des autres modèles, et après l’avoir essayé environ une heure hier, les résultats semblaient prometteurs
J’ai vu dans une discussion Reddit que l’équipe évaluait glm5.2, donc j’espère qu’il y en aura d’autres
GitHub Copilot est-il la plateforme la mieux placée pour les entreprises ?
Il prend en charge Claude, GPT, Gemini, et désormais même des modèles à poids ouverts. Les grandes organisations paient de toute façon à peu près au niveau des tarifs API, donc le coût est similaire quel que soit l’endroit où elles les utilisent
Il dispose d’une CLI d’agent et d’un SDK plutôt bons, et maintenant aussi d’une application desktop. Il y a aussi des agents hébergés, et on peut même exécuter des « Agentic Workflows » dans la CI
Sa réputation a-t-elle tellement chuté que seules les alternatives attirent l’attention ? Ou bien les utilisateurs hors entreprise sont-ils écartés par les coûts d’usage, au point qu’il n’y a plus de marketing gratuit ?
Nous avions gardé Copilot parce que les tokens étaient ridiculement bon marché, mais après le passage aux nouveaux prix, c’est devenu un service au coût comparable à openrouter, avec beaucoup moins de modèles
Je ne sais pas exactement pourquoi, mais l’impression n’était pas bonne
On en parle souvent dans mon entreprise, parce que les responsables de la gestion des fournisseurs ne comprennent pas l’écosystème des grands modèles de langage et pensent que Claude via Copilot et Claude via Claude Code sont identiques
Chaque fois qu’on me demande d’expliquer la différence, une simple comparaison côte à côte révèle dans 3 ou 4 cas sur 5 des performances nettement inférieures
Si vous faites partie d’une petite équipe qui veut essayer Copilot, je tiens à vous prévenir que vous risquez de perdre des heures à vous débattre avec la configuration de la facturation en suivant une documentation obsolète
En résumé, nous avons fini par recevoir un e-mail de GitHub indiquant que « Copilot Business est proposé aux équipes qui achètent 10 licences ou plus ». Ce n’est pas documenté, mais d’autres rencontrent le même problème : https://github.com/orgs/community/discussions/199346
Pour l’instant, nous restons sur Cursor, avec Kimi comme modèle principal sous le nom de « Composer »
Enfin disponible. Est-ce le premier LLM à poids ouverts de Copilot ? La porte est désormais ouverte