Nico accusé d’avoir détourné du code de Papermark pour sa data room
(twitter.com/mfts0)- Des accusations publiques affirment que le produit de data room de Nico ne serait pas le fruit d’un développement interne, mais semblerait provenir du code open source et sous licence entreprise de Papermark
- Le point central porte sur une possible violation du droit d’auteur et des licences, et la personne à l’origine de l’accusation exige que le produit soit immédiatement retiré
- L’affaire suscite de vives critiques, la présentant non pas comme une démarche consistant à « aller vite et casser des choses », mais comme quelque chose de plus proche de la fraude
- Il est aussi souligné que la controverse autour de ce produit pourrait faire naître des soupçons sur le reste des activités de Nico
- Garry Tan, Jared Friedman et Y Combinator sont également tagués, ce qui étend l’affaire à une question de réputation de la communauté YC
Soupçons de détournement de code de Papermark
- Des accusations publiques affirment que le produit de data room de Nico ne semble pas avoir été développé en interne, mais provenir du code open source et sous licence entreprise de Papermark
- La personne à l’origine de l’accusation estime qu’il est difficile d’y voir un simple développement rapide de produit ou du « vibe coding », et évoque une possible violation du droit d’auteur et des licences
- La demande est claire
- Le produit devrait être retiré immédiatement
- Si l’infraction est avérée, elle pourrait être considérée comme un acte plus grave qu’une simple erreur
Extension des critiques
- Les critiques ne se limitent pas au seul produit de data room de Nico, mais remettent aussi en question la crédibilité de l’ensemble de ses activités
- Garry Tan, Jared Friedman et Y Combinator ayant été tagués, l’affaire dépasse le différend entre particuliers et touche aussi à la réputation de la communauté YC
- À ce stade, les éléments rendus publics portent surtout sur les accusations et les demandes formulées ; aucune vérification supplémentaire ni réponse contradictoire n’est fournie
1 commentaires
Réactions sur Hacker News
En mettant une capture d’écran d’une page web dans un outil comme Figma Make, on peut produire une copie assez proche
C’est exactement l’impression que donne la capture d’écran : très similaire, sans être totalement identique. Le fait que beaucoup de formulations soient identiques vient probablement aussi de là. Le fait de ne même pas avoir confié la réécriture du texte à un outil de génération de texte relève simplement de la négligence
D’après un autre commentaire sur Twitter, ils ont probablement demandé à une IA de copier Papermark
Le commentaire de l’IA laisse des traces du type disant que la page a été alignée sur la “reference”
https://xcancel.com/ffumarola/status/2070479755892371713#m
Leur réponse était la suivante :
Donc ça ne me surprendrait pas tant que ça que Nico pense sincèrement que « nous n’avons pas copié le code » constitue une défense raisonnable. Cela ressemble à une règle claire, et les profils extrêmes de type “shape rotator” ont souvent du mal avec les zones grises dans des domaines comme le droit. En pratique, la violation du droit d’auteur, c’est souvent comme le critère pour définir la pornographie : on le reconnaît quand on le voit
Il a aussi affirmé quelque part que cette entreprise ou cette industrie représentait l’application la plus importante de l’IA dans le monde. Je n’ai aucun doute sur le fait qu’ils ont copié, et ce ne sont au minimum pas des gens dignes de confiance
https://x.com/nico_laqua/status/2061130574358773852?s=20
S’ils avaient fait ça à une entreprise plus encline à poursuivre, il y aurait probablement eu un procès, avec environ une chance sur deux de le gagner. Il est difficile de dire si cela serait considéré comme une copie d’éléments créatifs ou artistiques, ou simplement comme une reproduction du fonctionnement, mais s’il est acceptable de reproduire une fonctionnalité, copier l’expérience utilisateur dans son ensemble mène vite à une violation du droit d’auteur
Quant aux textes, pour une solution de data room en conditions réelles, ils relèvent selon moi largement d’un contenu standard et prévisible
Peux-tu donner un peu plus de contexte sur ce fil ? Je n’ai aucune idée de qui est Nico, de ce qu’est Papermark, ni de ce que ça fait
Indépendamment de ça, on a l’impression que les gens ne se contentent plus de refaire des solutions ou projets existants en vibe coding, mais s’habituent de plus en plus à « voler » du code open source et à l’utiliser comme bon leur semble sans respecter les présupposés moraux, éthiques et juridiques de l’open source. On dirait qu’il y a de plus en plus de violations de l’open source un peu partout, sans grandes conséquences juridiques.
En plus, une bonne partie des nouveaux développeurs arrivés uniquement via l’IA ne comprennent pas, ou ne se soucient pas, que FOSS ne veut pas dire gratuit comme dans « bière gratuite », mais qu’il s’agit de liberté.
Je travaille sur une bibliothèque GPL3 qui parse des fichiers de données binaires de sampleurs audio matériels. Quelqu’un a créé une application qui permet d’effectuer plusieurs opérations à partir de ma bibliothèque, et a respecté la licence GPL3.
Mais récemment, quelqu’un a totalement cloné cette app en vibe coding, en mettant même un site web et un lien d’achat à environ 60 dollars. C’était une copie tellement flagrante, avec seulement des couleurs différentes et une UI exactement identique, et les conditions de la GPL3 n’étaient pas respectées du tout. Les modérateurs ont retiré le post de la liste et bloqué le développeur de l’app clonée, et la communauté du forum a soutenu le développeur de l’app originale. Une demande de retrait DMCA a aussi été envoyée, et quelques jours plus tard le site du clone a été retiré.
Le développeur de l’app originale a eu de la chance, parce qu’il n’existe en pratique qu’un seul grand forum où sont postés des contenus sur ce fabricant, et que les modérateurs détestent aussi tout ce qui touche à l’IA. Ironiquement, le développeur de l’app originale avait lui aussi fait tout son travail en vibe coding. Sans ce forum et ses modérateurs, le développeur de l’app originale comme moi, en tant que mainteneur de la bibliothèque GPL3, aurions franchement été fichus.
La centralisation a des avantages. Sinon, je ne vois pas vraiment d’alternative, à part un mouvement populaire forçant tout le monde à revenir au code source fermé pour lancer une discussion sur le respect du travail d’autrui. Jusqu’ici, on s’appuyait sur un système de réputation et de réaction communautaire.
Les entreprises prennent l’habitude de pouvoir tout faire sans en subir les conséquences. « Move fast and break things » parlait au départ de technologie, mais c’est devenu une attitude vis-à-vis du droit. Uber a popularisé cette logique, et maintenant tout le monde fait pareil. Le fait que l’IA enfreigne le droit d’auteur fait partie de cette même dynamique.
Avec cette nouvelle manière de penser selon laquelle la loi est pour les perdants, on risque de traverser une période difficile.
Il faut désormais considérer que, sur Internet, tout est de fait à la disposition de tout le monde.
Parce que la seule manière de perdre à coup sûr, c’est de ne pas participer au jeu.
Papermark est l’alternative open source à DocSend. On peut l’utiliser en auto-hébergement ou en version hébergée, et c’est bien plus rentable que DocSend, d’où sa popularité.
Corgi est une startup d’assurance financée par YC, qui vend de l’assurance à d’autres startups YC. Nico en est le fondateur. L’entreprise a récemment levé 100 millions de dollars sur une valorisation d’environ 3 milliards de dollars, et fait actuellement partie des sociétés particulièrement poussées par YC.
Comme la souscription d’assurances nécessite beaucoup de documents, Corgi payait plusieurs milliers de dollars par mois à DocSend. Pour une raison ou une autre, Corgi semble avoir monté une équipe de 12 personnes pour créer sa propre alternative à DocSend, appelée Dataroom. Et Corgi a décidé d’en faire un produit SaaS sur un marché déjà encombré, en le positionnant comme un DocSend moins cher, à partir de 10 dollars par mois.
Papermark a immédiatement remarqué que le Dataroom de Corgi reprenait beaucoup de formulations et de structures identiques à son produit open source. Papermark en a donc conclu que Corgi avait repris son travail sans attribution. Corgi le nie, affirmant que les correspondances mot pour mot entre les produits ne sont qu’une simple coïncidence.
Une autre startup YC, Delve, a en fait fait ce dont Corgi est soupçonné — et bien davantage — avant de se faire prendre et d’être exclue de YC.
De ce que je vois, son raisonnement tient grosso modo en deux points :
Mais l’indice principal ici, c’est la mise en page et les formulations identiques entre les deux produits. Dire à un LLM « écris ce produit et fais-en une copie 1:1 » reste, selon toute définition de bon sens, une forme de copie. Prétendre que rien n’a été copié n’a aucun sens.
ShadCN est le système de design le plus populaire, celui que l’IA choisit automatiquement dans plus de 90 % des cas, et il est presque utilisé par défaut sur des plateformes comme lovable.
Google a copié l’API tout en gardant une implémentation en clean room, et cela a finalement été clairement jugé comme relevant du fair use. Si le fair use s’applique à un objet aussi strict que la réimplémentation d’une API, alors on peut considérer qu’il s’applique aussi à des objets bien plus flous comme la copie d’une UI ou d’une mise en page.
Je ne comprends toujours pas pourquoi des gens utilisent sérieusement ce qui était autrefois Twitter.
Même s’ils n’ont pas littéralement copié-collé le code comme ils le disent, il se peut qu’en pratique le LLM ait reproduit le même code à partir des résultats du crawling du dépôt, sans respecter la licence.
Cela ferait un bon litige civil à faire trancher par un tribunal. Leur défense semble être : « nous avons simplement demandé au LLM de reproduire votre travail, donc ce n’est pas ‘nous’ qui avons copié le code ». Ça sent mauvais.
La licence en question : https://github.com/papermark/papermark?tab=License-1-ov-file
C’est sous AGPL, ce qui signifie en gros que même si des utilisateurs interagissent avec le logiciel via le réseau, le code source doit être publié. Les projets qui utilisent ce code doivent eux aussi être sous AGPL.
Il existe des moyens de contourner cela en séparant les composants. Par exemple, utiliser un serveur d’authentification sous AGPL ne veut pas dire que le code contenant la logique métier doit aussi être affecté.
Surtout si l’on avait vu les polémiques passées, il aurait été possible de trouver une manière de concevoir le produit en respectant la licence.
Cela dit, je pars de l’hypothèse qu’il y a bien eu copie du code, et nous n’en avons pas la certitude. Ça paraît très similaire, mais il est difficile de savoir comment cela serait appliqué en pratique.
Les problèmes de droits d’auteur liés à ces modèles sont vraiment un chaos total
L’industrie tech fera n’importe quoi pour normaliser le vol et appeler ça de l’innovation
C’est la trajectoire typique d’une startup YC