Il s’agit d’un benchmark dans lequel l’auteur, contributeur Ruby, a demandé à Claude Code d’implémenter un mini Git dans 13 langages et a mesuré le temps, le coût et le nombre de lignes de code. Il a effectué 20 exécutions par langage, soit 600 exécutions au total, en utilisant le modèle Claude Opus 4.6.
Les résultats montrent que Ruby (0,36 $) → Python (0,38 $) → JavaScript (0,39 $) ont été les plus rapides et les moins coûteux, tandis que les langages à typage statique étaient 1,4 à 2,6 fois plus lents et plus chers. Avec l’ajout d’un vérificateur de types, Python/mypy est devenu 1,6 à 1,7 fois plus lent, et Ruby/Steep 2 à 3,2 fois plus lent. OCaml et Haskell, malgré un faible nombre de lignes de code, sont restés dans le bas du classement intermédiaire en raison d’une consommation élevée de tokens de réflexion.
L’auteur souligne que « la différence entre 30 et 60 secondes influence la concentration et le flux de développement, et que la vitesse de développement est en elle-même une dimension de la qualité ». Il ajoute toutefois que l’expérience reste limitée à une tâche unique de type prototypage et qu’à grande échelle, le typage statique peut avoir des avantages.
Aucun commentaire pour le moment.