Grok Code Fast 1

(x.ai)

7 points par GN⁺ 2025-08-30 | Aucun commentaire pour le moment. | Partager sur WhatsApp

grok-code-fast-1, lancé par xAI, est un modèle de codage IA ultra-rapide pour les développeurs, doté d’une forte réactivité et de fonctionnalités pensées pour les IDE
Ce modèle a été préentraîné principalement sur des jeux de données de programmation et conçu, à partir d’évaluations d’utilisateurs réels, pour exceller dans l’usage d’outils comme grep, le terminal et l’édition de fichiers
Côté performances, il atteint une vitesse de génération de 190 tokens par seconde et un score de 70,8 % sur SWE-Bench-Verified, avec de solides capacités en TypeScript, Python, Java, Rust, C++, Go et d’autres langages
Son tarif est fixé à 0,20 $ par million de tokens en entrée, 1,50 $ en sortie et 0,02 $ pour l’entrée mise en cache ; sur certaines plateformes partenaires (GitHub Copilot, Cursor, etc.), il est proposé gratuitement pour une durée limitée
Une variante prenant bientôt en charge les entrées multimodales, les appels d’outils parallèles et un contexte étendu devrait également être annoncée

Vue d’ensemble

grok-code-fast-1 de xAI est un modèle de codage IA ultra-rapide développé pour résoudre les problèmes de ralentissement dans les environnements de développement réels, où le raisonnement itératif et l’usage d’outils sont fréquents
Sur la base des retours d’ingénieurs en activité, l’architecture du modèle a été reconstruite depuis zéro pour être rapide, agile et adaptée aux tâches concrètes du quotidien
Les équipes d’ingénierie du raisonnement et du calcul ont introduit de nombreuses méthodes innovantes dans une technologie de service extrêmement rapide
- L’utilisateur peut avoir l’impression que plusieurs appels d’outils ont déjà eu lieu avant même d’avoir eu le temps de suivre le fil de la réflexion
L’optimisation du prompt caching a permis d’atteindre plus de 90 % de taux de hit cache dans les environnements partenaires

L’environnement d’apprentissage a été construit sur la base d’un vaste corpus de préentraînement centré sur la programmation
Un post-entraînement de haute qualité a été mené à partir de données réelles de pull requests et d’écriture de code
En collaborant étroitement avec différents partenaires de lancement, xAI améliore en continu le comportement du modèle dans les plateformes agentiques

grok-code-fast-1 maîtrise de façon fiable des outils de développement courants comme grep, le terminal et l’édition de fichiers
Les utilisateurs peuvent l’exploiter directement dans les principaux environnements de développement, notamment les IDE

Il prend en charge l’ensemble de la stack de développement logiciel
Il se montre particulièrement efficace en TypeScript, Python, Java, Rust, C++, Go et autres
Même avec une supervision minimale, il traite rapidement et avec précision diverses tâches de programmation telles que la création de projets from scratch, les questions-réponses sur une base de code et la correction précise de bugs

Grok Code Fast 1 offre la réactivité la plus rapide parmi les modèles actuels
Utilisé en le découpant en petites unités de travail, il est très avantageux pour construire des workflows itératifs et rapides
Exemple concret : un prototype de Battle Simulator a été achevé en une seule journée dans l’environnement Cursor
Il est plus efficace de planifier de grandes fonctionnalités, puis de les décomposer étape par étape pour les exécuter de manière itérative

0,20 $ par million de tokens en entrée
1,50 $ par million de tokens en sortie
0,02 $ par million de tokens d’entrée mis en cache
Grâce à ses performances élevées et à son tarif économique, il permet de traiter rapidement et efficacement les tâches de programmation du quotidien

Avec une vitesse de traitement de 190 tokens par seconde (TPS), il se situe au plus haut niveau du secteur
Comparé à d’autres modèles (Gemini 2.5 Pro, GPT-5, Claude Sonnet 4, Qwen3-Coder, Grok 4), il montre une forte compétitivité à la fois sur le prix et sur la vitesse de traitement
Des benchmarks publics variés et des tests réels menés par des développeurs ont été utilisés en parallèle
- 70,8 % obtenus sur un sous-ensemble de SWE-Bench-Verified
En combinant des évaluations humaines régulières par des ingénieurs en activité et des tests automatisés, xAI cherche à maximiser l’utilité concrète et la satisfaction

Le modèle est proposé via l’API officielle et les principaux partenaires, avec un essai gratuit également disponible pour une durée limitée
- GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, opencode, Windsurf, etc.
Des mises à jour continues et un cycle d’amélioration rapide sont promis
Une nouvelle variante, incluant des fonctionnalités comme les entrées multimodales, les appels d’outils parallèles et la prise en charge d’un contexte étendu, est également en cours d’entraînement
Un guide de prompt engineering est aussi proposé séparément
Il est possible de partager ses retours via la model card et des canaux de feedback (Discord, etc.)