Moonshot AI lance Kimi K2.7-Code
(marktechpost.com)Moonshot AI a lancé "Kimi K2.7-Code", un modèle de codage à poids ouverts centré sur les agents, qui améliore fortement les performances en programmation par rapport au modèle précédent et réduit de 30 % la consommation de tokens de raisonnement.
Traduction complète
Cette semaine, Moonshot AI a lancé Kimi K2.7-Code, un modèle centré sur les agents spécialisé dans le codage. Les poids du modèle sont distribués sur Hugging Face sous une licence MIT modifiée. Il est également accessible via l’API Kimi et Kimi Code. K2.7-Code vise les tâches d’ingénierie logicielle de longue durée plutôt que la conversation générale. Le modèle planifie sur plusieurs étapes, modifie du code, exécute des outils et effectue du débogage. Moonshot AI le propose en association avec une plateforme de codage par abonnement.
Spécifications de Kimi K2.7-Code
K2.7-Code est un modèle Mixture-of-Experts (MoE). Il compte au total 1 trillion (1T) de paramètres, avec 32 milliards (32B) de paramètres activés par token. Cette architecture sélectionne 8 experts par token parmi un total de 384 experts, avec 1 expert partagé. Elle comprend 61 couches au total, dont 1 couche dense.
Le mécanisme d’attention utilise MLA, et le chemin feedforward applique SwiGLU. L’encodeur visuel MoonViT ajoute 400 millions (400M) de paramètres pour les entrées image et vidéo. Le modèle est fourni avec une quantification native INT4. La fenêtre de contexte est de 256K tokens (262 144). Deux contraintes sont à noter. Le mode Thinking est obligatoire, et sa désactivation renvoie une erreur API. Les paramètres d’échantillonnage sont fixés à temperature 1.0, top_p 0.95, n 1 et penalty 0.0. La sortie maximale par défaut est de 32 768 tokens. L’auto-hébergement est possible avec vLLM, SGLang et KTransformers. Le dépôt Hugging Face est très volumineux, avec environ 595 Go sur disque. Il cible donc des déploiements de niveau serveur plutôt qu’un usage sur notebook.
Scores de benchmark
L’équipe Moonshot a publié les résultats de 6 benchmarks. Elle a comparé K2.7-Code à K2.6, GPT-5.5 et Claude Opus 4.8. K2.7-Code a dépassé K2.6 sur tous les critères. La plus forte progression en codage a été observée sur Kimi Code Bench v2, avec un score passant de 50,9 % à 62,0 %.
K2.7-Code a obtenu 81,1 % sur le benchmark MCP Mark Verified, dépassant les 76,4 % d’Opus 4.8. Il a également enregistré des résultats proches de GPT-5.5 sur MLS Bench Lite. K2.7-Code a été exécuté dans Kimi Code CLI, tandis que GPT-5.5 a été testé en Codex xhigh et Opus 4.8 dans l’environnement Claude Code xhigh.
1 commentaires
C’est vraiment impressionnant