1 points par GN⁺ 22 시간 전 | 1 commentaires | Partager sur WhatsApp
  • Kimi K2.7 Code est ajouté à GitHub Copilot et devient le premier modèle à poids ouverts pouvant être sélectionné dans le sélecteur de modèles
  • Hébergé par GitHub sur Microsoft Azure, il offre davantage de choix de modèles et une option moins coûteuse pour les workflows de développement
  • La facturation suit le modèle de tarification à l’usage selon le prix public du fournisseur ; pour le coût réel, il faut consulter la documentation sur les tarifs des modèles et des requêtes Copilot
  • Le déploiement commence progressivement pour les offres Copilot Pro, Pro+ et Max, avec disponibilité dans le sélecteur de modèles de Visual Studio Code
  • Dans Copilot Business et Enterprise, l’option est désactivée par défaut ; avant un usage en organisation, l’activation de la politique par l’administrateur et un examen de la sécurité, de la conformité et de la gouvernance des données sont nécessaires

Premier modèle à poids ouverts ajouté à Copilot

  • Kimi K2.7 Code est un modèle à poids ouverts désormais proposé officiellement dans GitHub Copilot
  • Il devient le premier modèle à poids ouverts disponible dans le sélecteur de modèles de Copilot
  • Il apporte davantage de choix de modèles et une option plus économique dans les workflows de développement
  • GitHub héberge le modèle sur Microsoft Azure

Facturation à l’usage

Portée de la disponibilité dans Copilot

  • Kimi K2.7 Code est d’abord déployé progressivement pour les offres Copilot Pro, Pro+ et Max
  • Les utilisateurs peuvent sélectionner ce modèle dans le sélecteur de modèles de Visual Studio Code
  • Le déploiement se fait par étapes et GitHub continue de surveiller la qualité et les performances du modèle
  • L’accès sera étendu dans les prochaines semaines à Copilot Business, Enterprise et à des écrans d’utilisation supplémentaires

Clients et interfaces pris en charge

  • Le sélecteur de modèles est disponible dans les environnements suivants
    • Visual Studio Code 1.127.0 ou version ultérieure
    • Visual Studio 17.14.6 ou version ultérieure
    • Copilot CLI
    • GitHub Copilot cloud agent
    • GitHub Copilot App
    • github.com
    • GitHub Mobile iOS et Android
    • JetBrains 1.9.1-251 ou version ultérieure
    • Xcode
    • Eclipse

Paramètres administrateur pour Business et Enterprise

  • Kimi K2.7 Code est désactivé par défaut dans Copilot Business et Copilot Enterprise
  • Pour que les membres d’une organisation puissent choisir ce modèle, l’administrateur de l’offre doit activer la politique Kimi K2.7 Code dans les paramètres Copilot
  • Tant que cette politique reste désactivée, le modèle ne peut pas être utilisé dans l’organisation concernée
  • Avant l’activation, il est recommandé aux administrateurs de vérifier qu’un modèle à poids ouverts répond à leurs exigences en matière de sécurité, de conformité et de gouvernance des données

Documentation et canal de retour

1 commentaires

 
Avis sur Hacker News
  • Les produits d’IA basés sur le cloud ne m’intéressent presque plus désormais
    Je suis lassé d’avoir vu trop souvent des fonctionnalités et workflows prometteurs que j’attendais devenir difficiles à utiliser pour toutes sortes de raisons : hausses de prix, impression de baisse des performances, arrêts de service, remplacements, etc.
    J’ai monté une petite machine et je me suis quasiment installé sur Qwen3.6 ; j’ajoute lentement moi-même les fonctionnalités dont j’ai besoin. Je ne sais pas si c’est au niveau de Claude, et j’ai arrêté de vérifier. Ça m’apporte déjà beaucoup de valeur, ça continue de s’améliorer, et même si l’herbe est peut-être plus verte ailleurs, j’aime le fait qu’elle ne change pas sous mes pieds

    • Je suis content que ce soit le commentaire le mieux classé. Moi aussi, je tourne entièrement en local
      Pour ceux qui n’ont pas assez de mémoire pour faire tourner de gros modèles autour de 32 Go, je veux signaler que les modèles élagués offrent aussi de très bonnes performances. Sur une petite machine, le modèle quantifié Q4 pruned unsloth de GLM 4.7 Flash, qui tient dans 14 Go, vaut le coup d’être essayé : https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
      D’habitude j’utilise LM Studio pour ce genre d’usage, mais unsloth propose aussi sa propre application Studio, qui peut être mieux adaptée à ce type de modèles quantifiés. J’ai utilisé GLM 4.7 Flash comme modèle principal pendant quelques mois : il était très tenace et très rapide, et me semble être un bon choix sur du matériel limité
    • Qwen3.6-35B-A3B-UD-Q4_K_M tourne à environ 11 tokens par seconde même sur ma vieille 1060. C’est vraiment délirant d’en être arrivés là
    • Ces temps-ci, les progrès de l’IA me donnent surtout l’impression de pousser des différences de fine-tuning
      Par exemple, le nouveau Claude est ajusté pour le codage agentique, ce qui peut même être nuisible pour du codage non agentique ; Fable 5 a l’air bon, mais son coût d’inférence est élevé et il y a de fortes chances de voir arriver une baisse de performances, des limites ou une refonte tarifaire après sa sortie. Gemini 3.5 a des limites plus généreuses, mais ses performances sont un peu inférieures
      Les nouvelles versions sortent et les numéros montent, mais je me demande si tous ces changements sont vraiment des avancées, ou simplement un tuning différent avec des performances par dollar similaires à celles du début de l’année. Les vrais changements se voient davantage dans de petits modèles comme Qwen ou Gemma 4 31B, et c’est assez magique, surtout en tenant compte des capacités multilingues
      Juste après avoir posté, j’ai vu une comparaison avant/après de Fable : la version réintroduite est encore en train d’être retouchée, et ses performances sur BridgeBench se sont effondrées de façon catastrophique : https://x.com/Hesamation/status/2072692225100612032
    • C’est assez tentant, mais quelle configuration de Mac mini faudrait-il pour faire tourner quelque chose comme ça ?
    • Moi aussi, j’ai installé Qwen3.6 sur un vieux MBP et je l’utilise avec satisfaction
      Ce n’est pas aussi rapide que le Claude que j’utilise au travail, mais ça tourne suffisamment bien en local, et je n’ai pas à m’inquiéter de voir des crédits ou des fonctionnalités disparaître soudainement
  • J’aime beaucoup Copilot CLI. Je le trouve plus logique et avec moins de friction que Claude Code
    J’aime aussi pouvoir alterner librement entre plusieurs modèles. Par exemple : « faire le plan avec Opus 4.6, le faire vérifier par GPT 5.4 et récupérer ses retours, puis implémenter avec Sonnet 4.6 »
    Mais à cause du changement de tarification de Copilot en juin, j’ai dû passer à Claude Code, à titre personnel comme pour tout le département de mon entreprise. En avril-mai, on dépassait légèrement les crédits inclus et on payait quelques dollars de plus ; à partir de juin, on épuisait le budget mensuel tous les 2 ou 3 jours
    Du point de vue client, c’est une hausse de prix complètement folle, et je ne sais pas à quoi pensait Microsoft. Même si ce tarif était nécessaire pour la viabilité du service, ils auraient dû attendre que les concurrents changent leurs prix d’abord. Je ne serais pas surpris qu’ils aient perdu plus de 50 % des clients Copilot le mois dernier
    Si, au final, tous les grands acteurs s’alignent sur ce niveau de prix, il faudra peut-être que l’État exploite une IA d’accès public, comme pour la télévision. Utiliser des modèles ouverts gratuits, faire tourner quelques data centers financés par l’impôt, avec des restrictions régionales et un throttling strict, mais en laissant les étudiants et les citoyens s’en servir librement
    Si dans quelques années tous les prix de l’IA atteignent le niveau de Copilot, seules les licornes pourront l’utiliser, et les autres n’auront plus aucune chance de rivaliser avec les entreprises qui utilisent l’IA

    • Tu dis qu’ils auraient dû attendre que les concurrents changent leurs prix, mais c’est en quelque sorte déjà ce qu’ils ont fait
      C’est littéralement une répercussion des coûts : https://platform.claude.com/docs/en/about-claude/pricing
      Anthropic propose aussi un abonnement, mais les entreprises ne veulent généralement pas l’utiliser. Parce que ce qui est soumis par ce canal peut être utilisé pour l’entraînement ou devenir une partie du modèle
      L’utiliser sans l’autorisation explicite de l’employeur peut constituer une violation de contrat et, en cas de procès, les conséquences peuvent être graves
    • La hausse de prix était délirante. Mon entreprise principale est aussi en train de migrer de Copilot vers un abonnement Claude Code
      En parallèle, on teste AWS Bedrock et Deepinfra pour des modèles à poids ouverts, au cas où Claude Code finirait par ne plus être une bonne affaire une fois aligné sur les vrais coûts en tokens
    • Pour la première fois depuis quelques mois, j’ai épuisé mes crédits Claude au travail et je suis revenu à Copilot ; c’était étonnamment correct
      Claude est largement en avance côté outils, mais la définition du modèle par sous-agent et l’accès à tous les modèles valent mieux que toutes les fonctionnalités que Claude propose actuellement réunies
      Dans mon entreprise, la seule limite à la quantité d’IA qu’on peut consommer par mois, ce sont les dollars ; donc ce qui réduit les coûts est, pour moi, le meilleur modèle et le meilleur environnement d’exécution. Copilot se débrouillait aussi mieux pour attribuer automatiquement aux sous-agents des modèles plus appropriés, tandis que Claude utilise souvent des modèles plus chers
    • Je suis sincèrement curieux : pourrais-tu expliquer plus en détail en quoi Copilot CLI te semble meilleur que Claude Code ? Quand j’ai le choix, j’utilise OpenCode, et je me demande ce qui te fait préférer Copilot CLI
    • Laisser le système choisir automatiquement le modèle n’est plus viable
      Cela dit, il existe des modèles efficaces capables d’exécuter un plan produit par un meilleur modèle. Quand on pense que la sélection automatique de modèles de Microsoft, dans son ancien modèle tarifaire déficitaire, choisissait des modèles de raisonnement de pointe pour des tâches comme résoudre des conflits de dépendances, c’est un peu gênant
  • J’utilisais GitHub Copilot pour le développement de VS 2026, en alternant avec ChatGPT et Claude, et c’était avant que je découvre Claude Code et l’app Codex
    Copilot me convenait pour mon usage, et 10 dollars par mois suffisaient
    Mais quand le nouveau modèle tarifaire a été introduit le mois dernier, les 10 dollars ont été épuisés en quelques jours. Je sais que l’ancien tarif n’était pas tenable, mais cela m’a fait passer à Claude Code et Codex, et je n’ai pas eu à regarder en arrière. Les tokens de Claude Code et de Codex sont eux aussi vendus à un prix largement subventionné, mais autant en profiter tant que ça dure
    On sent une différence entre utiliser Claude via Copilot et utiliser Claude directement dans Claude Code. Je ne sais pas ce que Microsoft fait en arrière-plan

    • L’environnement d’exécution est très important. Les outils disponibles et le prompt système diffèrent selon l’environnement d’exécution
      Anthropic a une petite longueur d’avance à la fois sur l’environnement d’exécution et sur le modèle, ce qui lui donne le meilleur des deux mondes
      Côté Microsoft, c’est sans doute le même modèle, mais les outils et prompts autour semblent moins bons, et les résultats le sont donc aussi
    • C’était similaire quand j’ai quitté Copilot dans Zed
      J’utilise maintenant l’environnement d’exécution reasonix pour DeepSeek, et en cas de hit de cache, le coût est presque nul. Même en utilisant des fournisseurs américains non subventionnés comme Digital Ocean ou Cloudflare
    • Je suis moi aussi passé à Cursor. Une fois qu’on lui indique comment appeler msbuild, il édite tout seul, même sans plugin Visual Studio natif
      Le langage cible est C++, et ça ne pose aucun problème
    • Ces dernières semaines, le coût de GitHub Copilot a fortement gonflé : ce qui coûtait auparavant 100 dollars en demande désormais 300
      J’aime bien utiliser Claude dans VS Code via Copilot, et j’ai l’impression que cela donne un meilleur code, car on contrôle mieux la qualité du code. C’est beaucoup plus transparent que Claude Code, c’est open source, et l’interface de l’IDE offre davantage de contrôle sur le contexte et les artefacts générés
      La hausse des coûts n’est pas uniquement due à l’augmentation des prix : les agents du modèle Opus consomment aussi davantage de tokens. Je suis donc passé à Claude Code et j’utilise toujours Opus 4.6 avec satisfaction. Fable et 4.7 ont tendance à s’égarer et à inventer des hypothèses sur des tâches de plus grande ampleur, ce qui rend les résultats brouillons
    • Avec Claude 4.8 Opus, mon quota Copilot s’est probablement épuisé en 2 ou 3 prompts. Je m’attendais à ce que ce soit mauvais, mais pas à ce point. C’était bien tant que ça a duré
  • Enfin une alternative d’un grand fournisseur utilisable par les entreprises est arrivée
    Les gens voulaient un moyen d’exécuter des modèles chinois chez un fournisseur de confiance, et GitHub le propose
    Si l’on croit les benchmarks, les performances sont au niveau de Sonnet 4.6. Reste à voir si cela vaut le coup aux tarifs de GitHub

    • Puisque Microsoft est passé à une facturation basée sur les tokens, il doit proposer des options moins chères
      GPT-5.4 valait 1x pour les abonnés annuels, mais vaut maintenant 6x. Les requêtes premium s’épuisent en quelques prompts. GitHub Copilot à 10 dollars par mois était auparavant le meilleur rapport qualité-prix pour utiliser à bas coût les modèles des labos d’IA américains
    • Je ne crois pas aux benchmarks. J’ai essayé Kimi K2.7 plusieurs fois et j’ai été déçu
      Il a tourné autour du pot là où Claude aurait terminé en une seule fois. Cela dit, mon chemin d’accès passait par Ollama Cloud, et je ne sais pas s’ils fournissaient le vrai modèle ou une version quantifiée ; la quantification a peut-être dégradé les performances
      La bonne nouvelle, malgré tout, c’est qu’un précédent est créé. Si Microsoft propose maintenant Kimi K2.7, il pourrait bientôt proposer GLM 5.2, qui est réellement un modèle très compétitif
    • On va peut-être encore me traiter de VRP, mais comme c’est pertinent, ça m’est égal
      Synthetic exploite ses propres modèles à des tarifs raisonnables, dont GLM5.2 et Kimi K2.7-Code
      Lien de parrainage : https://synthetic.new/?referral=kwjqga9QYoUgpZV
  • Entrée : 0,95 dollar, hit de cache : 0,19 dollar, sortie : 4,00 dollars
    C’est le même prix que celui facturé par Moonshot, et à peu près dans la gamme de prix de GPT 5.4 mini, donc ce n’est pas une mauvaise option
    Exemple de prompt idiot qui gaspille des tokens pour le contexte : « Joue tout seul au morpion sur un plateau 5x5. Tu gagnes si tu alignes 5 symboles. »
    Avec Kimi K2.7, cela coûte 0,006 dollar et on peut voir toute la trace brute du raisonnement. GPT-5.4 mini coûte 0,016 dollar et c’est résumé
    Si vous vous posez la question, les deux jouent de manière incroyablement stupide
    Kimi :

    A B C D E
    1 . . . . .
    2 . . . . .
    3 X X X X X
    4 . O O O O
    5 . . . . .

    GPT 5.4 mini :

    1: X X X X X
    2: O O . . .
    3: . . O . .
    4: . . . O .
    5: . . . . O

    • Pour info, pour ceux que ça intéresse, GPT 5.5 joue le même coup nul que 5.4 mini, mais coûte 4 fois plus cher
      Fable produit une partie plausible pour 40 cents

      X X O O O
      O O X X X
      X X X O O
      X O O X O
      X O X X O

    • Bonne idée. J’ai demandé la même chose à Haiku dans Claude Chat sur iOS : il a créé un jeu React interactif, implémenté les règles, puis m’a laissé jouer moi-même
      À 1 dollar en entrée et 5 dollars en sortie, joli coup, Anthropic !

    • Les grands modèles de langage sont faibles aux jeux, mais ils sont tout à fait capables d’écrire un agent d’apprentissage par renforcement qui apprend le jeu lui-même

    • Si je m’ennuie vraiment, je pense faire jouer deux modèles aux échecs l’un contre l’autre
      Il doit déjà exister quelque part un benchmark d’échecs ou un tournoi de grands modèles de langage

  • Il est étrange qu’AWS Bedrock prenne en charge ce type de modèles de manière aussi limitée
    Il n’y a que Kimi 2.5, qwen 3 coder, DeepSeek V3.2, GLM 5 environ, et aucun modèle récent

    • Je me demande si c’est une décision produit ou une contrainte GPU
      Les instances Inf2 nécessitent AWS Neuron [1]. Il est aussi possible que porter les modèles pour qu’ils tournent sur ce matériel prenne beaucoup trop de temps
      [1] https://aws.amazon.com/ai/machine-learning/neuron/
  • Le coût d’exécution est clairement beaucoup plus bas que celui des autres modèles, et après l’avoir essayé environ une heure hier, les résultats semblaient prometteurs
    J’ai vu dans une discussion Reddit que l’équipe évaluait glm5.2, donc j’espère qu’il y en aura d’autres

  • GitHub Copilot est-il la plateforme la mieux placée pour les entreprises ?
    Il prend en charge Claude, GPT, Gemini, et désormais même des modèles à poids ouverts. Les grandes organisations paient de toute façon à peu près au niveau des tarifs API, donc le coût est similaire quel que soit l’endroit où elles les utilisent
    Il dispose d’une CLI d’agent et d’un SDK plutôt bons, et maintenant aussi d’une application desktop. Il y a aussi des agents hébergés, et on peut même exécuter des « Agentic Workflows » dans la CI
    Sa réputation a-t-elle tellement chuté que seules les alternatives attirent l’attention ? Ou bien les utilisateurs hors entreprise sont-ils écartés par les coûts d’usage, au point qu’il n’y a plus de marketing gratuit ?

    • Le rug pull consistant à changer les prix sans préavis n’a pas été bien accueilli côté entreprises
    • Nous avons annulé les forfaits de tout le monde et déployé liteLLM en interne
      Nous avions gardé Copilot parce que les tokens étaient ridiculement bon marché, mais après le passage aux nouveaux prix, c’est devenu un service au coût comparable à openrouter, avec beaucoup moins de modèles
    • C’était le cas avant, mais plus depuis qu’ils ont décidé de tuer eux-mêmes le service
    • Pour une raison ou une autre, Copilot me paraît plus idiot que Claude dans VS Code ou Codex dans VS Code
      Je ne sais pas exactement pourquoi, mais l’impression n’était pas bonne
    • L’environnement d’exécution de Copilot est médiocre par rapport aux autres environnements basés sur des CLI que je teste. Étonnamment mauvais
      On en parle souvent dans mon entreprise, parce que les responsables de la gestion des fournisseurs ne comprennent pas l’écosystème des grands modèles de langage et pensent que Claude via Copilot et Claude via Claude Code sont identiques
      Chaque fois qu’on me demande d’expliquer la différence, une simple comparaison côte à côte révèle dans 3 ou 4 cas sur 5 des performances nettement inférieures
  • Si vous faites partie d’une petite équipe qui veut essayer Copilot, je tiens à vous prévenir que vous risquez de perdre des heures à vous débattre avec la configuration de la facturation en suivant une documentation obsolète
    En résumé, nous avons fini par recevoir un e-mail de GitHub indiquant que « Copilot Business est proposé aux équipes qui achètent 10 licences ou plus ». Ce n’est pas documenté, mais d’autres rencontrent le même problème : https://github.com/orgs/community/discussions/199346
    Pour l’instant, nous restons sur Cursor, avec Kimi comme modèle principal sous le nom de « Composer »

  • Enfin disponible. Est-ce le premier LLM à poids ouverts de Copilot ? La porte est désormais ouverte