L’affaire de la fuite de Claude Code

(build.ms)

11 points par GN⁺ 28 일 전 | 3 commentaires | Partager sur WhatsApp

La fuite du code source de Claude Code montre que, plus que la qualité du code, c’est l’adéquation produit-marché qui détermine le succès
Anthropic accorde plus d’importance qu’au code lui-même aux systèmes d’observation et aux mécanismes d’auto-réparation, tout en maintenant des cycles de développement rapides
Ce qui compte pour les utilisateurs, ce n’est pas la perfection du code, mais le fait que le produit fonctionne réellement bien, et le marché reste toujours en situation de sous-offre
Après la fuite, Anthropic a envoyé en masse des demandes DMCA, ce qui a alimenté dans la communauté les discussions autour des implémentations en clean room et de la liberté du code
Cet incident met en lumière l’importance de l’intégration et de l’expérience utilisateur plutôt que la valeur absolue du code, et réinterroge la nature même de l’écosystème IA

La relation entre qualité du code et succès produit

La fuite du code source de Claude Code est considérée comme un événement qui révèle que le succès produit et l’adéquation au marché ont plus d’impact que la qualité du code
- Développeurs, designers, PM, marketeurs, CEO et bien d’autres se sont enthousiasmés pour Claude Code, mais la qualité réelle du code s’est révélée faible
- Malgré cela, le produit obtient de très bons résultats sur le marché
L’idée essentielle est que « même un mauvais code peut réussir », ce qui montre que le Product Market Fit est plus important que la qualité du code
- Les cas de Cursor et de Claude Code prouvent que même des développeurs exigeants privilégient les fonctionnalités et l’utilité plutôt que la qualité du code
Certains développeurs soutiennent qu’une faible qualité de code n’est pas viable à long terme, mais cette fuite sert ici de contre-exemple
- Elle montre qu’« on peut créer un excellent produit avec un mauvais code »

Des systèmes et de l’observabilité plus importants que le code

La manière dont Claude Code est développé met l’accent sur les systèmes qui observent le fonctionnement et les effets du code, plus que sur le code lui-même
- Anthropic ne se contente pas d’améliorer la qualité du code, mais construit aussi un système d’observation qui surveille en temps réel l’impact des modifications
Dans le processus de QA, l’accent est mis non pas sur la correction manuelle des bugs, mais sur des systèmes d’auto-réparation capables de détecter et de corriger automatiquement les problèmes
- Exemple : si une erreur de connexion survient, le système détecte automatiquement le problème et annule la modification de code
Cette approche maximise la vitesse et l’efficacité et permet, au prix d’un certain niveau de risque, des cycles de développement rapides

L’importance absolue de l’adéquation produit-marché

Pour les utilisateurs, ce qui importe n’est pas la qualité du code, mais le fait que le produit fonctionne réellement bien
- La plupart des utilisateurs ne s’intéressent pas à la structure interne ni aux détails du code
Si Claude Code devenait instable ou subissait fréquemment des interruptions dues à une surcharge serveur, OpenAI ou Google pourraient absorber cette demande
- OpenAI dispose d’une infrastructure serveur suffisante, et Google tente aussi d’améliorer ses produits de codage
Le marché reste toujours en situation de sous-offre par rapport à la demande des consommateurs, et la concurrence devrait se poursuivre dans ce domaine

La controverse sur le droit d’auteur et l’ironie de « sa propre médecine »

Juste après la fuite du code, Anthropic a envoyé en masse à GitHub des demandes de retrait au titre du DMCA, entraînant la fermeture des dépôts concernés
- Des DMCA ont même été envoyés à des forks de dépôts officiels contenant les exemples de code de l’entreprise
Par la suite, la communauté a vu apparaître des « clean room implementations », avec des projets réécrivant Claude Code en Python, Rust, etc.
- L’industrie de l’IA affirme depuis longtemps que lorsqu’une IA réécrit du code, il ne s’agit pas d’une œuvre dérivée, et Anthropic défendait aussi cette position
Cette affaire a été perçue comme un cas où Anthropic a expérimenté les conséquences des principes qu’elle défendait elle-même
- Elle a en même temps renforcé l’idée que le code doit être libre, avec une orientation encore plus libertaire que celle du mouvement historique du logiciel libre

L’impact réel de la fuite et la nature de l’écosystème IA

La fuite du code source de Claude Code est jugée comme ayant très peu d’impact concret
- La vraie valeur de l’écosystème IA réside dans l’intégration entre le modèle et le harness, et non dans le code en lui-même
Même si Anthropic publiait son code en open source, ce pour quoi les utilisateurs paient, c’est la qualité du résultat et l’expérience d’un service abouti
- Le Codex d’OpenAI ou Gemini de Google sont eux aussi open source, mais n’ont pas acquis le même niveau de notoriété que Claude Code
L’agent de codage Pi fonctionne avec quatre outils simples (read, write, edit, bash) et s’interface avec divers modèles ; il est très apprécié pour une conception optimisée pour la manière de penser des développeurs
- À l’inverse de l’approche multifonctionnelle de Claude, cela montre la diversité des expériences d’intégration entre modèles et outils

Réévaluation de la valeur du code et importance de l’intégration

Cette fuite renforce le scepticisme à l’égard de la valeur absolue du code
- Ce qui compte réellement, c’est l’intégration, qui englobe à la fois l’adéquation produit-marché et l’harmonie entre modèle et harness
Une codebase propre n’a de sens que si elle produit de meilleurs résultats pour les utilisateurs
- La capacité à résoudre les problèmes et la qualité de l’expérience utilisateur priment sur la qualité du code
La fuite de Claude Code a provoqué moins un changement concret qu’un changement de perception
- Elle a révélé une réalité : « la vraie valeur n’est pas le code, mais tout ce qu’il y a autour du code »

3 commentaires

ytuniverse 28 일 전

Anthropic mis à part, ça me fait surtout penser à ce groupe qui disait simplement faire un portage dans une autre langue et appelait ça une clean room...
Je trouve vraiment risible qu’ils ne pensent même pas que ça crée un moral hazard. Ils ont bloqué tous les onglets GitHub Discussions / Issues et n’ont laissé ouvert que Discord ; franchement, qu’est-ce qu’ils essaient de faire ? lol

Le plus drôle, c’est qu’alors qu’ils appartiennent eux-mêmes à une organisation, ils avaient ciblé partout une certaine entreprise sur LinkedIn et ailleurs en l’accusant d’avoir copié un LLM chinois, puis se sont totalement ridiculisés avec un raisonnement erroné, et apparemment ça ne leur vient même pas à l’esprit haha

Honnêtement, j’avais une bonne opinion du projet Harness LLM en le regardant, mais j’ai changé d’avis.

t7vonn 28 일 전

Le code ne coûte rien, montrez-moi le produit

GN⁺ 28 일 전

Avis de Hacker News

Dans cette histoire, la partie la plus sous-estimée est la question du droit d’auteur
Anthropic a utilisé le code d’autrui comme données d’entraînement en invoquant le fair use, mais quand son propre code a fuité, l’entreprise a sorti le DMCA
Cette contradiction est au fond le résultat du cadre juridique qu’ils ont eux-mêmes contribué à créer
- En principe, la loi doit s’appliquer de manière égale à tout le monde
  Mais la big tech et les plus riches cherchent à la faire appliquer uniquement dans leur intérêt
  Autrement dit, le vrai problème, c’est cette logique aristocratique du type : « je peux copier ce qui t’appartient, mais toi tu ne peux pas copier ce qui m’appartient »
- Si un tiers utilise leur code source, il est difficile de faire tenir une défense fondée sur le fair use
  Anthropic a aussi obtenu gain de cause sur certains points, mais a perdu sur environ la moitié
  Si le code a été obtenu illégalement, l’argument du fair use ne vaut plus grand-chose
- Ce n’est pas une contradiction. Ni Anthropic ni OpenAI n’ont jamais affirmé qu’il était légal de redistribuer du code divulgué
  Ce n’est qu’un raisonnement émotionnel du type « l’IA, c’est mal »
- Certains ont aussi plaisanté en se demandant si Claude n’avait pas lui-même divulgué son code pour défendre des valeurs constitutionnelles
- Dans cette fuite, il ne s’agissait pas du modèle, mais bien du code de Claude lui-même
  Il est donc légitime qu’Anthropic utilise le DMCA
Je me demandais pourquoi l’auteur de Coding as Creative Expression avait autant changé
Son ancien texte donnait une impression de réflexion humaine et d’introspection, alors que celui-ci semblait écrit par un LLM
- L’auteur est intervenu lui-même pour s’en expliquer
  Ce texte était une courte note rédigée directement sur son téléphone pendant une promenade matinale
  Il a expliqué qu’il s’était fixé cette année pour objectif de consigner ses idées rapidement, donc le texte est moins profond, mais il n’a pas utilisé d’IA
- Aujourd’hui, à cause de l’abus de l’IA, nous sommes entrés dans une époque où même un texte réellement écrit par un humain est suspect
  Il dit détester le fait qu’il soit devenu si difficile de distinguer l’authenticité d’un contenu
- Certains trouvent que le texte ressemble à du LLM, mais en réalité il donne plutôt l’impression d’un texte écrit à la hâte sur téléphone
  Cela dit, l’influence des LLM semble avoir laissé cette structure simple en points
- En réalité, ce n’est peut-être pas l’auteur qui a changé, mais le lecteur lui-même
  Nous vivons désormais à une époque où, qu’une phrase soit longue ou courte, dès que la grammaire est correcte, on conclut automatiquement que c’est un LLM
Le fait qu’Anthropic ait utilisé le DMCA pour faire retirer le dépôt Claude Code m’a semblé être une ironie juridique
Affirmer qu’un code utilisé pour entraîner un modèle n’a pas de protection par droit d’auteur, tout en disant que le code généré en a une, paraît contradictoire
- Un utilisateur a créé un projet qui contourne cela en abstrahant Claude sous forme de directives d’architecture style PRD
  Il existe aussi une GUI appelée Claudette
- Je me demande si, dans le cas où un agent réécrirait le code avec quelques modifications, GitHub considérerait cela comme une œuvre dérivée
- Du point de vue d’un avocat, dès qu’il existe une contribution créative humaine minimale, la protection par droit d’auteur peut s’appliquer
Face à l’affirmation selon laquelle « le code n’a pas d’importance », certains estiment que, dans une startup en phase initiale, c’est surtout l’adéquation produit-marché (Product-Market Fit) qui compte
Mais avec le temps, la qualité du code devient importante
- En réponse, d’autres disent que même au début, le code compte
  Parce qu’il constitue la procédure concrète de résolution du problème
- Des outils comme Claude Code sont de toute façon des produits de génération remplaçables en 2 à 3 ans, donc il est difficile d’en attendre une grande maturité
- En pratique, Claude Code est jugé peu pratique à cause de restrictions DRM, et certains le trouvent inférieur à OpenCode
  C’est d’ailleurs ce qui les a poussés à tester d’autres modèles
- Même après avoir trouvé son marché, on peut se demander pourquoi tout change aussi souvent
  Il y a aussi cette interrogation : un énorme codebase vibe-coded pourra-t-il être refactoré en un code réellement humain ?
- Un risque encore plus grand que la qualité du code, c’est la dépendance structurelle de tout un secteur à quelques grandes entreprises de LLM
  Si les modèles locaux ne s’imposent pas comme alternative, il y a un vrai risque que le savoir-faire de maintenance devienne dépendant d’acteurs externes
À propos de l’idée selon laquelle « un mauvais code peut quand même produire un produit à succès », certains pensent qu’il est encore trop tôt pour juger de sa durabilité
Pour l’instant, nous sommes simplement dans une phase de hype
- Avec l’entrée dans l’ère de l’IA, l’équilibre entre bon code vs bon produit est devenu encore plus confus
  Il y a peut-être des situations où la qualité du code compte moins, mais le coût de maintenance ne peut pas être ignoré
  Personnellement, je trouve plus amusant de créer de petits outils sur mesure, et dans ce cadre la qualité du code m’a paru moins importante
- L’auteur dit être d’accord avec cela, et précise que son texte n’était pas une affirmation tranchée, mais une discussion spéculative
L’expression « implémentation en salle blanche » me paraissait étrange
- L’auteur a ensuite reconnu, dans une conversation sur Bluesky, après en avoir parlé avec un avocat, qu’il avait donné un mauvais exemple
- Une approche plus appropriée serait d’entraîner un LLM avec Claude Code comme donnée d’apprentissage, puis de présenter sa sortie comme une nouvelle œuvre
- À l’origine, une clean room désigne une procédure où l’on extrait la spécification (spec) d’une implémentation existante, puis où l’on réécrit à partir de cette spécification
On peut aussi interpréter cette fuite de sécurité comme la conséquence d’une faible qualité du code
L’entreprise a simplement eu de la chance ; si des données clients ou des poids de modèle avaient fuité, elle aurait pu s’effondrer du jour au lendemain
- En regardant le code des autres, on voit souvent des erreurs de sécurité si simples qu’elles en deviennent ennuyeuses
  Mettre des clés API côté client, ou oublier un middleware d’authentification, par exemple
  Dire que « la qualité n’a pas d’importance », cela veut juste dire que l’incendie ne s’est pas encore déclaré
J’ai l’impression que tout le débat « code vs produit » n’a pas vraiment de sens
Le développement exige une maîtrise technique et des principes, tandis que le produit et le marketing sont d’autres sujets
Avec un mauvais code, on ne peut pas maintenir un bon produit sur le long terme
La fuite de Claude Code n’est pas une simple erreur, mais un effondrement des pratiques de sécurité, potentiellement à un niveau relevant de la sécurité nationale
- Quelqu’un a plaisanté en disant : « est-ce que le LLM n’était pas en train de se builder lui-même et ne s’est pas divulgué tout seul ? »
  Selon lui, le vrai problème, c’est d’avoir utilisé un LLM pour coder en premier lieu
- À l’inverse, certains pensent que c’est précisément parce que le produit a été rapidement vibe-coded qu’il a pu réussir sur le marché
  Claude Code était fondamentalement un outil temporaire, et le modèle restait l’actif essentiel
  À leurs yeux, si le code source a été caché, c’était surtout une stratégie pour ralentir la concurrence, pas une mesure de sécurité
En tant que créateur de Hyperlambda, j’ai le sentiment que l’essentiel de la complexité vient du déploiement et du packaging
Ce type de fuite rappelle à quel point la structure périphérique peut être plus dangereuse que la logique centrale
Aujourd’hui, beaucoup de logiciels tournent dans un état surchauffé et inefficace
Parce que leurs créateurs se préoccupent davantage de l’adéquation au marché que de l’efficacité
Si cette tendance continue, dans cinq ans nous verrons tous un enfer de spaghetti code
- L’auteur précise qu’il ne défend pas la baisse de qualité, mais qu’il décrit une réalité dont les gens ne se soucient plus vraiment
  Personnellement, il continue à relire son code, à le refactorer et à faire des efforts pour préserver la qualité
  Mais du point de vue des entreprises, le profit à court terme passe d’abord, et les problèmes de qualité n’apparaissent qu’ensuite