5 points par GN⁺ 1 일 전 | 1 commentaires | Partager sur WhatsApp
  • Le copyright du code assisté par IA dépend de l’existence d’une contribution créative humaine significative ; un résultat principalement produit par l’IA et à peine retouché par un humain peut ne pas être protégé
  • Le critère central est la meaningful human authorship ; au-delà du simple fait d’indiquer un objectif, les décisions créatives comme définir l’architecture, filtrer les résultats et réorganiser le code pèsent davantage
  • Indépendamment de la naissance ou non d’un copyright sur le code, s’il existe une work-for-hire doctrine ou des clauses larges de cession de PI, le code assisté par IA créé avec du temps de travail, du matériel de l’entreprise, un projet de l’entreprise ou des outils sous licence de l’entreprise a de fortes chances d’appartenir à l’entreprise
  • Même en cas de propriété du code, la contamination par licence open source est une question distincte ; en particulier, un résultat qui copie substantiellement à l’identique du code de type GPL peut entraîner une violation de licence
  • Aujourd’hui, les points relativement clairs sont les suivants : absence de protection en l’absence d’auteur humain, attribution des droits selon le contrat de travail, et risque de reproduction textuelle de code GPL ; dans la pratique, la conservation des traces et le scan des licences priment souvent sur une décision de justice

Critères de copyright et zones encore non tranchées

  • La protection par copyright ne s’applique qu’aux œuvres créées par des humains, et un résultat principalement généré par l’IA sans contribution créative humaine significative peut ne pas être protégeable selon les critères actuels
  • Même après l’affaire Thaler, la Cour suprême ne s’est pas prononcée sur le fond ; la décision du DC Circuit a été maintenue, mais il n’existe pas encore de précédent directement applicable tel quel aux résultats de codage assisté par IA
  • Le point clé que les tribunaux n’ont pas encore directement traité est de savoir quel niveau d’intervention humaine est requis dans une œuvre assistée par IA
    • Contrairement à une image purement générée par IA avec zéro intervention humaine, le code implique souvent un humain qui fixe partiellement la direction et valide le résultat, ce qui rend la frontière plus floue
    • Dans le domaine du code, il n’existe pas encore de décision appliquant directement le principe d’auteur humain aux sorties d’outils de codage IA
  • Si le code généré par l’IA a été accepté presque sans modification, il est possible que personne ne puisse revendiquer de copyright dessus, ce qui affaiblirait aussi les moyens d’action si un concurrent le copiait tel quel
  • Le cœur du raisonnement repose sur la meaningful human authorship ; au-delà d’un simple objectif donné, les choix créatifs liés à la structure, au filtrage des résultats et à la refonte de la conception sont déterminants

Comment démontrer l’apport d’un auteur humain

  • Une contribution humaine significative ne se mesure pas de façon tranchée par un pourcentage ou un nombre de modifications ; ce qui compte est de savoir si l’humain a réellement pris des décisions créatives
    • Choix d’architecture

      • Il faut décider quoi rejeter parmi les brouillons
      • Il faut recomposer le résultat pour l’adapter à une conception précise
      • Si, après une instruction courte comme « crée un module de rate limiting pour une API », l’outil génère plusieurs fichiers et procède à des révisions itératives, il n’existe toujours pas de conclusion claire sur le point de savoir si la contribution humaine serait jugée suffisante par un tribunal
      • Un module fortement retravaillé avec des changements de direction a davantage de chances d’être reconnu comme œuvre humaine, alors qu’un code accepté tel quel pourrait être interprété en sens inverse
      • Allen v. Perlmutter reste un point de bascule important pour apprécier le caractère suffisant de l’intervention humaine : même avec plus de 600 prompts et des retouches Photoshop, les éléments de base produits par l’IA ont été refusés à l’enregistrement
      • Dans Zarya of the Dawn, seul le texte écrit par l’humain a été enregistré, les images générées par Midjourney étant exclues ; ce principe rejoint, dans une codebase assistée par IA, l’idée de protéger séparément les éléments directement créés par l’humain
      • Les documents de conception peuvent servir de preuve
      • Les décisions de conception consignées dans les messages de commit peuvent aussi servir de preuve
      • Les ADR peuvent également servir de preuve
      • Les journaux de prompts montrant des changements de direction délibérés peuvent aider
      • Pour élargir les parties susceptibles d’être protégées, il est préférable de documenter ce qui a été décidé directement et comment cela a été modifié

Le contrat de travail tranche souvent d’abord la propriété

  • Avant même de se demander si le code est protégeable par copyright, il faut vérifier à qui les droits sont attribués dès l’origine
  • Un contrat de travail classique attribue à l’entreprise les productions réalisées dans le cadre des fonctions, ce qui est généralement expliqué par la work-for-hire doctrine
  • Un résultat créé sur le temps de travail, dans le cadre d’un projet de l’entreprise, avec du matériel de l’entreprise ou à l’aide d’un outil de codage IA fourni par l’entreprise a de fortes chances d’être considéré comme appartenant à l’entreprise, qu’il s’agisse de code écrit manuellement ou assisté par IA
  • En pratique, les contrats sont souvent rédigés plus largement que les principes juridiques de base, et les formulations suivantes peuvent englober le code assisté par IA
    • Les œuvres créées avec du matériel ou des ressources de l’entreprise peuvent être incluses
    • Les inventions ou développements réalisés pendant la période d’emploi peuvent être inclus
    • Les logiciels créés avec l’aide d’outils sous licence de l’entreprise peuvent être inclus
  • La mention company-licensed tools peut en particulier s’étendre jusqu’aux projets personnels
    • Si l’entreprise a déployé Claude Code, Cursor ou Copilot pour l’équipe
    • Et que le même outil a aussi été utilisé sur un side project en dehors des heures de travail
    • Une clause large de cession de PI peut alors ouvrir la voie à une revendication de l’entreprise
  • Le texte indique qu’il est juridiquement difficile de considérer comme automatiquement valable l’argument selon lequel un résultat deviendrait une œuvre dérivée de la PI de l’entreprise au seul motif que du code de l’entreprise était ouvert dans l’IDE et visible par l’IA
  • En revanche, si la rédaction contractuelle est large, une possibilité de revendication apparente peut exister indépendamment de ce que l’IA a réellement fait
  • Pour isoler un side project, il est plus sûr de séparer complètement le workflow avec un compte personnel, un matériel personnel et des outils payés à titre personnel

Risque de contamination par les licences open source

  • Même si l’on possède le code généré par l’IA, la question de savoir si ce code traîne avec lui des obligations invisibles liées à des licences open source est distincte
  • Les outils de codage IA sont entraînés sur de vastes ensembles de code public, y compris du code sous licence copyleft comme GPL ou LGPL
  • Les licences copyleft imposent, en cas de distribution d’une œuvre dérivée, une obligation de publication sous la même licence
    • S’il s’agit d’un dérivé de code GPL, il faut aussi publier son propre code source sous cette même licence
    • Ignorer l’existence de la licence ne constitue pas une défense
  • Le critère du risque juridique ne porte pas sur la similarité fonctionnelle, mais sur une reproduction textuelle substantielle
    • Un résultat qui se comporte comme du code GPL
    • Et un résultat qui reproduit presque à l’identique du code GPL sont deux questions différentes
  • Le risque se concentre du côté de la copie textuelle, mais sans scan, il est difficile de savoir dans quelle situation se trouve une codebase actuelle
  • Début 2026, dans le chardet community dispute, chardet a été réécrit avec Claude puis redistribué sous licence MIT, ce qui a provoqué un conflit sur le point de savoir s’il s’agissait ou non d’une implémentation clean room
    • Il s’agissait d’un conflit communautaire et non d’un procès, et rien n’a été juridiquement tranché de manière définitive
    • En revanche, le fait que la copie à l’identique de code de type GPL constitue une violation de licence est déjà bien établi
  • Ce qui n’est pas encore tranché, c’est de savoir si une sortie d’IA qui reproduit des motifs issus des données d’entraînement peut être qualifiée de reproduction textuelle
  • Dans les opérations de conseil en fusions-acquisitions, ce risque est déjà traité comme un vrai sujet, et les scans de licences des codebases IA entrent dans les diligences
  • Doe v GitHub porte notamment sur la question de savoir si Copilot reproduit du code sous licence sans en mentionner l’origine ; au avril 2026, l’affaire est toujours pendante devant le Ninth Circuit
    • Le tribunal de première instance a rejeté la plupart des demandes, mais l’appel suit son cours
    • Indépendamment de l’issue du litige, GitHub a ajouté des duplicate detection filters, et les pratiques du secteur ont déjà évolué

Ce qu’il faut faire concrètement dès maintenant

  • Lancer un scan de licences

    • Pour une codebase assistée par IA, il est important de commencer par un scan de licences open source
    • FOSSA — outil complet largement utilisé en entreprise
    • Snyk Open Source — bonne intégration GitHub, donc facile à insérer dans le workflow d’une équipe de développement
    • Black Duck — souvent utilisé comme standard dans les due diligences de M&A
    • Ces outils scannent une codebase pour trouver les correspondances avec des bibliothèques open source connues ainsi que les licences associées
  • Conserver la trace de la contribution créative humaine

    • Les éléments permettant de prouver une meaningful human authorship sont souvent déjà produits au fil du travail d’ingénierie, mais ils ont davantage de valeur s’ils sont conservés délibérément
    • Les messages de commit doivent documenter ce qui a été modifié et pourquoi, plutôt que simplement reprendre le résultat généré par l’IA
      • Un historique comme « Restructured Claude’s module architecture, rejected initial state management approach, rewrote error handling from scratch » peut servir de preuve
      • Un message comme « Add rate limiting module » met beaucoup plus difficilement en évidence l’apport humain
    • Il est aussi préférable de conserver, via export ou capture d’écran, les journaux d’interaction de Claude Code et Cursor
    • Les documents de conception, ADR et notes rédigés avant le code généré peuvent servir de trace montrant que la structure a d’abord été définie par un humain
  • Vérifier les clauses de PI du contrat de travail

    • Il faut vérifier directement dans le contrat les sections intellectual property, IP assignment et work product
    • « Œuvre créée pendant le temps de travail » est plus étroit que « œuvre créée avec les ressources de l’entreprise »
    • « Liée à l’activité de l’entreprise » est plus étroit que « tout développement logiciel »
    • La mention company-licensed tools peut relier à un projet personnel des traces d’usage d’outils IA
    • Pour mener un projet indépendant
      • Il faut négocier en amont un carveout écrit
      • Il faut séparer totalement matériel personnel, temps personnel et outils personnels
      • Il peut malgré tout être nécessaire d’avancer en acceptant le risque d’une revendication de l’entreprise
  • Vérifier le type de conditions d’Anthropic

    • Avant un lancement commercial, il faut consulter anthropic.com/legal et examiner la différence entre consumer terms et commercial terms
    • Les offres free / Pro cèdent les droits sur les outputs à l’utilisateur, mais la portée de l’IP indemnification est plus limitée
    • Les offres API / enterprise prévoient, en plus de la cession des droits sur les outputs, une défense plus large en cas d’allégations d’atteinte au copyright liées à l’usage autorisé et aux outputs
    • Cela dit, ce type d’indemnisation ne règle pas à votre place un éventuel problème de contamination GPL à l’intérieur de la codebase
    • Cet aspect doit être géré directement au moyen de scans de licences et d’une gouvernance interne

Ce qui est déjà établi et ce qui reste ouvert

  • Trois points sont déjà relativement clairs
    • Les œuvres dépourvues d’auteur humain ne bénéficient pas de la protection par copyright
    • La work-for-hire doctrine peut s’appliquer indépendamment de la manière dont le code a été généré
    • La reproduction textuelle de code GPL constitue une violation de licence
  • Deux autres points n’ont pas encore été clairement tranchés par les tribunaux
    • Dans un workflow agentique, quelle quantité d’instructions et de modifications humaines suffit pour atteindre un niveau d’auteur suffisant
    • Si une sortie d’IA reproduit des motifs issus des données d’entraînement, si cela doit être qualifié de reproduction textuelle
  • La question de savoir si ces sujets déboucheront bientôt sur des contentieux de grande ampleur reste entièrement spéculative
  • En pratique, l’endroit où cette incertitude devient le plus vite un problème réel n’est pas le tribunal mais les due diligences de M&A et les examens d’investissement institutionnel
  • Les acquéreurs et investisseurs posent déjà ces questions comme conditions de closing, et même si vous n’êtes pas dans cette situation aujourd’hui, il est avantageux de préparer dès maintenant les traces et les scans

1 commentaires

 
GN⁺ 1 일 전
Avis Hacker News
  • Il faut voir cela sous le même angle que la jurisprudence sur la génération d’images
    Comme cela a déjà été établi dans Zarya of the Dawn, les éléments écrits par un humain étaient protégés, mais les images générées par l’IA ne l’étaient pas, et les designs de personnages sélectionnés, promptés et curés par un humain n’ont pas non plus obtenu de protection par le droit d’auteur
    Je ne vois pas en quoi le code serait différent. Demander à Claude de créer une fonction est plus proche du fait de demander à Midjourney de générer une image que d’écrire soi-même directement la fonction
    Si les ingénieurs ont tendance à le ressentir autrement, c’est souvent parce qu’ils pensent à l’analogie du compilateur : or un compilateur est un outil déterministe qui produit la même sortie pour la même entrée, alors qu’un LLM ne fonctionne pas ainsi. C’est précisément là que le Copyright Office trace la frontière, et le domaine de l’image est simplement arrivé à cette conclusion plus tôt

    • Du coup, je me demande s’il existe réellement quelque chose qui empêche une personne de déposer un enregistrement de copyright à son propre nom
      Le fait qu’une autre personne puisse réutiliser le même prompt pour reproduire quelque chose de similaire ne rend pas forcément sa revendication de droits caduque
  • Un cert denial ne fixe pas le droit
    La Cour suprême peut refuser d’examiner un recours pour des raisons sans rapport avec le fond, donc cela ne règle pas à l’échelle nationale la question en litige

    • C’était d’ailleurs formulé ainsi à l’origine dans le TFA
      Le fait que la Cour suprême n’ait pas examiné le recours de Thaler ne signifiait pas qu’elle approuvait le raisonnement des juridictions inférieures ni qu’elle tirait une conclusion nationale ; cela voulait seulement dire que la décision du DC Circuit restait en vigueur, que la position du Copyright Office demeurait, et qu’aucun tribunal n’avait encore rendu de décision contraire
      Mais la formulation citée n’apparaît plus dans le TFA
    • J’ai l’impression qu’il manque encore de jurisprudence qui teste frontalement cette conclusion
      Je ne me souviens pas d’un arrêt ayant confirmé lequel des éléments énumérés suffit à reconnaître la qualité d’auteur
      En particulier, j’aimerais savoir si le fait de rejeter à répétition des résultats puis de rediriger la production dans une autre direction a déjà été reconnu comme de la création humaine
      Ce qui est clair aujourd’hui, c’est qu’on peut disclaim les parties du code non écrites par un humain, et que le Copyright Office exige effectivement cette divulgation et ce disclaimer. Je serais preneur de sources plus solides à citer
    • Malgré tout, j’ai l’impression que l’effet de précédent d’un arrêt de cour d’appel reste bien valable
      N’est-ce pas justement l’effet juridique central de son infirmation que de lui faire perdre sa valeur de précédent ?
      En théorie, un précédent non revu par la Cour suprême peut toujours être contesté, mais en pratique il fonctionne souvent comme du droit jusqu’à ce qu’il soit renversé. Ce cas ne me semble pas très différent
    • Je ne sais pas exactement comment définir meaningful human authorship
      Le fait d’avoir fait la revue du code est-il meaningful ?
      Si je modifie et édite le code généré, cela devient-il une œuvre humaine ?
    • C’est une remarque juste, donc j’ai corrigé le texte
      Un cert denial signifie simplement que la Cour suprême n’a pas accepté d’entendre l’affaire ; cela n’équivaut pas à approuver le raisonnement des juridictions inférieures ni à trancher nationalement la question
      La décision du DC Circuit reste valide et la position du Copyright Office demeure cohérente, mais on est davantage face à une doctrine stabilisée qu’à une règle définitivement fixée par la Cour suprême
  • Je pense bien que la personne qui donne ses instructions à l’agent devrait avoir le droit d’auteur sur le résultat, mais la base même qui permet à cet agent de produire quoi que ce soit repose selon moi sur de l’IP détournée
    Dans l’OSS en particulier, ce qui m’inquiète est que cette approche permette une forme de copyright washing, et c’est pourquoi je pense qu’un développeur OSS a intérêt à publier sous la licence copyleft la plus forte qu’il peut raisonnablement assumer
    https://jackson.dev/post/moral-ai-licensing/

    • Il est amusant de voir l’industrie du copyright remplacer discrètement copyright infringement par le terme accusateur stealing
      Si l’original est toujours là, qu’est-ce qui a exactement été volé ?
      Même dans Dowling v. United States, 473 U.S. 207 (1985), la vente non autorisée n’a pas été considérée comme un bien « stolen, converted or taken by fraud » au sens du National Stolen Property Act
    • Je pense que le copyright laundering relève presque du fantasme
      Si un tribunal juge qu’une sortie de LLM est suffisamment dérivée, d’autant plus si ce LLM a été entraîné sur des originaux contrefaits, alors la personne qui redistribue cette sortie dérivée engage sa responsabilité pour violation du droit d’auteur
      Le fait de construire un LLM peut être transformateur, mais la sortie contrefaisante elle-même ne l’est pas
    • Le droit d’auteur n’est pas un droit naturel, c’est un mécanisme accordé par l’État pour promouvoir le progrès de la science et des arts utiles
      Donc si le droit d’auteur finit par freiner ce progrès, il est parfaitement légitime de prévoir des exceptions
    • Je me demande vraiment s’il existe une base juridique au fait de dire que la personne qui donne des instructions à l’agent possède le droit d’auteur
      Si l’on regarde Community for Creative Non Violence v. Reid(https://en.wikipedia.org/wiki/Community_for_Creative_Non-Violence_v._Reid), le simple fait de commander un travail et d’en donner l’orientation ne fait pas du commanditaire l’auteur : c’est la personne qui réalise effectivement le travail qui l’est
      Un transfert contractuel des droits est possible, mais depuis les affaires du type selfie du singe, il est aussi bien établi que le droit d’auteur ne peut être attribué qu’à un humain
      Un LLM n’étant pas humain, il ne peut pas détenir de droit d’auteur ; et s’il n’a pas de droit d’auteur au sens juridique, il n’a rien à te céder contractuellement
    • Honnêtement, je comprends mal pourquoi cette position est si répandue
      Quand j’écris du code, je suis moi aussi influencé par les innombrables sources que j’ai vues au cours de ma formation et de ma carrière, et en ce sens le fonctionnement d’un LLM, qui affine ensuite ses sorties à partir du code qu’il a vu, n’est pas si différent
      On répondra immédiatement : « ce code, il n’avait pas le droit de le lire », mais cette logique ne me convainc pas non plus. La plupart du code dont j’ai appris quelque chose était protégé par le droit d’auteur, et sauf pour mon code personnel, les droits appartenaient généralement à quelqu’un d’autre. Même du code confidentiel sous NDA ou lié à la défense a ensuite influencé ma manière de programmer
      C’est pareil en art. En photo, j’ai été influencé par Ansel Adams ; en peinture, par Bob Ross et divers professeurs ; j’ai pris des fragments vus dans le travail des autres pour les mêler à ma propre vision et produire autre chose
      Pourtant, je ne pense pas que cette simple relation d’influence permette à quiconque de revendiquer des droits sur mon résultat
      Les plus jeunes autour de moi ont eux aussi appris à partir de mon code, et j’ai même écrit des livres sur le développement logiciel. J’espère qu’un jour mon travail artistique aura lui aussi assez de valeur pour que quelqu’un en absorbe quelque chose
      Bien avant l’arrivée des LLM, je n’ai jamais souhaité que mon travail soit scellé avec moi et que mes idées m’accompagnent dans la tombe
      Au fond, nous sommes tous juchés sur les épaules de géants, et sans absorber les travaux antérieurs, nous n’aurions accompli qu’une infime fraction de ce que nous avons accompli aujourd’hui
      Dans quelques décennies je serai mort et mon nom vite oublié, mais si les logiciels, les photos ou les tableaux que j’ai créés laissent des ondes dans le temps, cela ressemble à une petite forme d’immortalité
  • J’aimerais qu’on arrête de poster des commentaires générés sur HN
    Ce n’est pas autorisé par les règles, et on a déjà vu ce schéma plus de 30 fois
    Bien sûr, je ne peux pas en être sûr à 100 %, mais l’évaluation logicielle et le schéma global sont assez convaincants
    Voir https://news.ycombinator.com/newsguidelines.html#generated et https://news.ycombinator.com/item?id=47340079

    • La remarque est juste, et je m’en excuse
      J’ai utilisé un assistant IA dans ma réponse, et je ne le referai plus
  • Cette question est amusante comme exercice intellectuel, mais dans la réalité, j’ai l’impression que ce sera surtout celui qui a l’argent qui l’emportera
    Penser qu’Anthropic ne pourra pas détenir Claude Code simplement parce que Claude l’a écrit me semble relever du vœu pieux

    • En plus, la réponse variera probablement d’un pays à l’autre
      Tous les pays ne se rangent pas implicitement du côté de l’acteur le plus riche, donc il est difficile d’anticiper l’issue
    • Si on en arrive à dire que l’art genAI n’est pas protégeable mais que le code genAI l’est, alors ce sera vraiment l’Almighty Dollar à l’œuvre
    • Intuitivement, si l’on pense qu’Anthropic en sera propriétaire, c’est en réalité la work-for-hire doctrine qui l’explique le mieux
      Plus que de savoir si Claude l’a écrit, il semble plus plausible que l’entreprise détienne les droits du fait des contrats de travail des ingénieurs qui lui ont donné les instructions
      En revanche, la question des demandes de retrait DMCA est plus intéressante : la DMCA exige que le demandeur affirme de bonne foi qu’il détient le droit d’auteur
      Si un tribunal concluait plus tard que la base de code a été majoritairement écrite par l’IA et n’est donc pas protégeable, alors ces 8 000 takedowns pourraient être contestés comme des demandes DMCA de mauvaise foi
      C’est un enjeu juridique plus concret et plus dissociable que la simple question de propriété
    • Ce n’est pas un vœu pieux, car la propriété n’est pas automatiquement déterminée
      Dans le système juridique américain, un modèle n’est pas une personne et ne peut donc pas posséder de biens ; il ne peut pas non plus céder par contrat une propriété intellectuelle qu’il ne possède pas lui-même, et cela me paraît relativement clair
    • J’imagine mal les entreprises vouloir détenir du code malveillant, du code illégal ou du code utilisé pour des crimes
      Pourtant, les autorités semblent peu se soucier du fait que grok génère du CSAM ou du revenge porn, ce qui donne une étrange impression : vouloir posséder seulement le bon côté des choses tout en évitant les mauvaises responsabilités
  • Du point de vue des entreprises, cela ressemble à une approche assez habile
    On commence par utiliser claude code pour produire quelque chose, et on se demande seulement ensuite à qui appartient ce code
    La gold rush actuelle autour de nous révèle selon moi la myopie des dirigeants. Dans mon entreprise aussi, nos EM poussent pour que tout le monde utilise Claude au plus vite
    D’abord, dépendre trop fortement de Claude Code finit par faire perdre la compréhension de la base de code
    Ensuite, cela détruit de bonnes habitudes de développement comme l’XP ou la revue de code. Désormais, c’est Claude qui révise le code de Claude
    Troisièmement, cela abîme le travail d’équipe. Comme il devient plus facile et moins coûteux pour un seul développeur de traiter seul tout le flux du backend jusqu’au frontend, des tâches auparavant réparties entre les équipes FE et BE se retrouvent concentrées chez une seule personne
    Quatrièmement, auparavant on ignorait les commentaires en répétant que le code lui-même était la documentation, mais désormais, à cause des limites de contexte, il faut de nouveau ajouter des explications pour Claude. Quand un humain ne comprenait pas, c’était supposé être de sa faute ; devoir soudain accepter une régression pour s’adapter au contexte étroit de Claude me paraît injuste
    Je pourrais continuer, mais au fond le moteur de ce changement culturel reste l’argent. C’est pour ça que j’appelle cela une gold rush, et que je regarde le spectacle avec du popcorn

    • J’ai l’impression que les gens ont oublié beaucoup trop vite
      Quand Copilot est arrivé, les avertissements étaient pourtant clairs : à cause des problèmes d’attribution de licence, il ne fallait pas l’utiliser sur du code d’entreprise
      Qu’est-ce qui a changé aujourd’hui ? Est-ce le fait qu’Anthropic promette une défense juridique et d’indemnify ses clients qui a fait basculer l’ambiance ?
    • Pour le reste, je suis globalement d’accord, mais le fait qu’une seule personne conçoive ensemble le FE et le BE était déjà souvent préférable
      Le backend et le frontend doivent être pensés ensemble, et quand les équipes sont séparées, le coût de coordination est souvent plus élevé
    • À long terme, cela semble rendre beaucoup trop facile l’introduction de mauvaises abstractions
      Si le modèle mental humain s’atrophie peu à peu, il devient aussi plus difficile d’expliquer de manière responsable comment le système fonctionne en cas d’incident, ainsi que ce qui est prévu pour la suite
      Même si des généralisations erronées s’installent, les IA peuvent faire passer le code, la revue et l’approbation ; dans ce cas, on ne sait plus vraiment qui tient le volant
    • Le point n°3 ne produit de meilleurs résultats que rarement
      En général, il vaut mieux que l’équipe discute collectivement des exigences et des pièges, puis qu’une seule personne prenne en charge l’implémentation
  • L’EU AI Act ajoute ici une couche supplémentaire
    L’article 50 impose de divulguer aux utilisateurs finaux les contenus générés ou manipulés par l’IA, et cette obligation de transparence pèse sur le deployer, pas sur le fournisseur du modèle
    Donc même si la question du copyright se réglait en faveur de l’humain qui a prompté, une entreprise qui distribue à grande échelle des résultats assistés par l’IA aurait quand même une obligation distincte de divulgation
    Pour l’instant, la plupart ne le font pas vraiment correctement
    La question de la propriété et celle de l’obligation de divulgation sont indépendantes l’une de l’autre, mais les organisations ont souvent tendance à les mélanger

    • Mais est-ce que du code est vraiment du content ?
      Cette disposition semble davantage viser des vidéos donnant l’illusion du réel ou d’autres contenus fabriqués par l’IA, plutôt que du code d’application interne
  • Si l’on a fourni à l’outil la spécification du code voulu, il me semble assez clair qu’on a déjà fourni un apport créatif
    Après tout, un compilateur n’est-il pas assez similaire ? Un LLM agent ressemble simplement à un outil bien plus sophistiqué qu’un compilateur traditionnel, capable de produire un résultat à partir de spécifications beaucoup moins détaillées

    • Mais le fait de fournir à un prestataire humain la spécification du code souhaité n’a pas, de manière répétée, été considéré par les tribunaux comme un apport créatif au sens du droit d’auteur
      Pour posséder ce code, il fallait que le prestataire transfère explicitement les droits
    • Une spécification n’est pas toujours un apport créatif
      Par exemple, si je me contente de prompter « écris-moi un rate limiter en Python », je n’ai décidé ni de l’API, ni de l’algorithme de bucket de requêtes, ni de l’endroit où stocker les compteurs
      Je n’ai énoncé que des faits, et les faits ne sont pas créatifs par nature
      Le compilateur est aussi différent sur un autre point : le binaire produit n’est pas traité comme une œuvre distincte. C’est un peu comme convertir un format d’image en PDF : on reste sur la même œuvre
      Avec un LLM, ce n’est pas le cas. L’entrée peut ne pas être protégeable, et la sortie n’est pas une transformation mécanique mais le produit de choix effectués en cours de route
      En pratique aussi, si l’on exécute dix fois le même prompt, on peut obtenir dix résultats sensiblement différents
      Donc j’ai du mal à croire que n’importe quel niveau de prompting suffira comme créativité reconnue juridiquement
    • L’analogie du compilateur est un bon point de départ, mais le Copyright Office a précisément traité cette question
      Le cœur du sujet n’est pas de savoir si une entrée a été fournie, mais si l’expression créative de la sortie reflète une paternité humaine
      Avec un compilateur traditionnel, le programmeur est l’auteur de toute l’expression du code source ; avec un LLM, le programmeur n’apporte que l’intention, tandis que les décisions expressives sur la structure, les noms, les patterns ou l’implémentation sont prises par le modèle
      La question de savoir si cette différence est juridiquement déterminante est actuellement débattue dans Allen v. Perlmutter, et les mémoires de summary judgment pour début 2026 sont déjà terminés, ce qui pourrait en faire la prochaine décision marquante
    • Pour moi, cela ressemble au fond à la question de savoir qui possède le binaire produit par un compilateur
  • Tout cela est intéressant en théorie, mais dans la pratique, je pense que c’est généralement peu important
    Presque personne ne croit sérieusement que son code constitue un moat fort, et sur le terrain le sentiment que le code relève du droit d’auteur est assez faible
    Moi aussi, sous plusieurs employeurs, j’ai réécrit les mêmes fragments de code encore et encore, et j’imagine que la plupart des ingénieurs ont fait pareil. Il est aussi courant d’utiliser du code pris sur Stack Overflow sans examiner rigoureusement l’attribution
    Ce sujet ressort surtout dans des conflits empreints de rancœur. Le procès d’Oracle contre Google à propos d’Android, accusé d’avoir trop imité ses API, en est l’exemple type, et la Cour suprême a finalement conclu au fair use
    Il y a aussi eu des cas de hedge funds à haute fréquence attaquant d’anciens salariés, et aux États-Unis n’importe qui peut attaquer en justice pour n’importe quel motif
    Donc oui, une bataille du type Ellison contre Page et Brin jusqu’à la Cour suprême reste possible, mais dans 99,9 % des cas j’ai le sentiment que cela n’aura aucun effet réel sur le terrain
    https://www.supremecourt.gov/opinions/20pdf/18-956_d18f.pdf

    • Dès qu’on passe du côté des dirigeants non techniques, la vision change de manière frappante
      Beaucoup voient le code comme un immense IP et comme un secret commercial
      En tant que CTO, quand je dis que « globalement, le code n’est pas un secret si extraordinaire », je vois souvent des regards stupéfaits
      Une entreprise a failli abandonner un gros contrat parce qu’elle devait divulguer son code source sous NDA ; en expliquant pourquoi cette réaction était excessive, j’ai fini par la convaincre
      Mais cette vieille façon de penser reste encore très profondément ancrée
    • Je trouve étrange que personne ne parle de convergence
      C’est pourtant exactement de cela qu’il s’agit : si chaque caractère du code à écrire est pratiquement imposé à l’avance par les API nécessaires, alors il n’y a ni expression artistique ni droit d’auteur
      En revanche, si l’on conçoit une API entièrement nouvelle, là il peut y avoir matière à protection
    • Toutes les licences open source reposent sur l’idée que le code est protégeable par le droit d’auteur
    • L’idée que « le code n’est pas protégeable par le droit d’auteur » me paraît assez inhabituelle
      Les petits extraits que tu cites ne le sont peut-être pas, mais à plus grande échelle, entreprises et particuliers considèrent en général le code comme une propriété intellectuelle relevant du droit d’auteur
      Si le code n’était pas protégeable, d’où le GPL tirerait-il sa force ?
      Par exemple, pourquoi le simple soupçon que du code Microsoft ait pu se retrouver dans ReactOS suffirait-il à placer un projet pendant des mois ou des années en locked-down review mode ?
      Pourquoi les entreprises prendraient-elles soin d’indiquer dans les contrats de travail qu’elles détiennent le droit d’auteur sur le code ?
      En dehors des API, de l’interopérabilité et des implémentations trop triviales, j’ai plutôt l’impression que presque tout le monde reconnaît le caractère protégeable du code
    • Sinon, à quoi servirait une clean room implementation ?
      Il suffit de demander aux développeurs d’émulateurs ou à ceux de ReactOS
      https://reactos.org/forum/viewtopic.php?t=21740
  • Même l’idée selon laquelle « le code généré par Claude Code ou Cursor, si tu ne l’as pas modifié de manière significative, pourrait n’être protégé par le droit d’auteur pour personne » comporte des exceptions
    Si ce code répète textuellement un extrait substantiel d’une œuvre existante, l’auteur original peut toujours faire valoir son droit d’auteur, et on tombe alors immédiatement dans une question de contrefaçon