1 points par GN⁺ 3 시간 전 | 1 commentaires | Partager sur WhatsApp
  • Des accusations publiques affirment que le produit de data room de Nico ne serait pas le fruit d’un développement interne, mais semblerait provenir du code open source et sous licence entreprise de Papermark
  • Le point central porte sur une possible violation du droit d’auteur et des licences, et la personne à l’origine de l’accusation exige que le produit soit immédiatement retiré
  • L’affaire suscite de vives critiques, la présentant non pas comme une démarche consistant à « aller vite et casser des choses », mais comme quelque chose de plus proche de la fraude
  • Il est aussi souligné que la controverse autour de ce produit pourrait faire naître des soupçons sur le reste des activités de Nico
  • Garry Tan, Jared Friedman et Y Combinator sont également tagués, ce qui étend l’affaire à une question de réputation de la communauté YC

Soupçons de détournement de code de Papermark

  • Des accusations publiques affirment que le produit de data room de Nico ne semble pas avoir été développé en interne, mais provenir du code open source et sous licence entreprise de Papermark
  • La personne à l’origine de l’accusation estime qu’il est difficile d’y voir un simple développement rapide de produit ou du « vibe coding », et évoque une possible violation du droit d’auteur et des licences
  • La demande est claire
    • Le produit devrait être retiré immédiatement
    • Si l’infraction est avérée, elle pourrait être considérée comme un acte plus grave qu’une simple erreur

Extension des critiques

  • Les critiques ne se limitent pas au seul produit de data room de Nico, mais remettent aussi en question la crédibilité de l’ensemble de ses activités
  • Garry Tan, Jared Friedman et Y Combinator ayant été tagués, l’affaire dépasse le différend entre particuliers et touche aussi à la réputation de la communauté YC
  • À ce stade, les éléments rendus publics portent surtout sur les accusations et les demandes formulées ; aucune vérification supplémentaire ni réponse contradictoire n’est fournie

1 commentaires

 
GN⁺ 3 시간 전
Réactions sur Hacker News
  • En mettant une capture d’écran d’une page web dans un outil comme Figma Make, on peut produire une copie assez proche
    C’est exactement l’impression que donne la capture d’écran : très similaire, sans être totalement identique. Le fait que beaucoup de formulations soient identiques vient probablement aussi de là. Le fait de ne même pas avoir confié la réécriture du texte à un outil de génération de texte relève simplement de la négligence

  • D’après un autre commentaire sur Twitter, ils ont probablement demandé à une IA de copier Papermark
    Le commentaire de l’IA laisse des traces du type disant que la page a été alignée sur la “reference”
    https://xcancel.com/ffumarola/status/2070479755892371713#m

  • Leur réponse était la suivante :

    The team that made dataroom has stated that they did not use any of papermark’s code and that dataroom was made from scratch with inspiration from existing document sharing softwares, and that this post’s allegations of us stealing code are false. [...]
    En regardant les captures d’écran, il est clair qu’ils ont quasiment copié toute la page, autant le design que les textes. Le fait que le fondateur, Nico Laqua, se contente en substance de répondre « nous n’avons pas copié le code » sans assumer aucune responsabilité en dit long sur ses standards moraux et ceux de l’entreprise. Ce n’est peut-être pas suffisamment grave pour justifier un procès, mais cela n’en fait pas quelque chose de juste pour autant
    https://x.com/nico_laqua/status/2070158170937581951

    • J’avais passé un entretien chez Corgi il y a quelques années quand ils recrutaient leur premier ingénieur, et le courant n’était vraiment pas passé avec Nico ; alors que ce n’était qu’un simple entretien téléphonique de présélection, c’est resté l’un des entretiens les moins fluides que j’aie connus
      Donc ça ne me surprendrait pas tant que ça que Nico pense sincèrement que « nous n’avons pas copié le code » constitue une défense raisonnable. Cela ressemble à une règle claire, et les profils extrêmes de type “shape rotator” ont souvent du mal avec les zones grises dans des domaines comme le droit. En pratique, la violation du droit d’auteur, c’est souvent comme le critère pour définir la pornographie : on le reconnaît quand on le voit
    • C’est la même personne qui se vantait autrefois de travailler le week-end et comparait sa compagnie d’assurance sans grand intérêt au projet Manhattan
      Il a aussi affirmé quelque part que cette entreprise ou cette industrie représentait l’application la plus importante de l’IA dans le monde. Je n’ai aucun doute sur le fait qu’ils ont copié, et ce ne sont au minimum pas des gens dignes de confiance
      https://x.com/nico_laqua/status/2061130574358773852?s=20
    • Le fait que ce ne soit « peut-être pas suffisant pour entraîner un procès » tient surtout à ce que les projets open source intentent rarement des actions en justice
      S’ils avaient fait ça à une entreprise plus encline à poursuivre, il y aurait probablement eu un procès, avec environ une chance sur deux de le gagner. Il est difficile de dire si cela serait considéré comme une copie d’éléments créatifs ou artistiques, ou simplement comme une reproduction du fonctionnement, mais s’il est acceptable de reproduire une fonctionnalité, copier l’expérience utilisateur dans son ensemble mène vite à une violation du droit d’auteur
    • Le simple fait que Nico continue d’enfoncer le mensonge suffit à montrer quel genre de personne il est
    • Le design vient de shadcn, un système de design très populaire sous licence MIT
      Quant aux textes, pour une solution de data room en conditions réelles, ils relèvent selon moi largement d’un contenu standard et prévisible
  • Peux-tu donner un peu plus de contexte sur ce fil ? Je n’ai aucune idée de qui est Nico, de ce qu’est Papermark, ni de ce que ça fait
    Indépendamment de ça, on a l’impression que les gens ne se contentent plus de refaire des solutions ou projets existants en vibe coding, mais s’habituent de plus en plus à « voler » du code open source et à l’utiliser comme bon leur semble sans respecter les présupposés moraux, éthiques et juridiques de l’open source. On dirait qu’il y a de plus en plus de violations de l’open source un peu partout, sans grandes conséquences juridiques.

    • Oui. C’est devenu bien plus facile maintenant.
      En plus, une bonne partie des nouveaux développeurs arrivés uniquement via l’IA ne comprennent pas, ou ne se soucient pas, que FOSS ne veut pas dire gratuit comme dans « bière gratuite », mais qu’il s’agit de liberté.
      Je travaille sur une bibliothèque GPL3 qui parse des fichiers de données binaires de sampleurs audio matériels. Quelqu’un a créé une application qui permet d’effectuer plusieurs opérations à partir de ma bibliothèque, et a respecté la licence GPL3.
      Mais récemment, quelqu’un a totalement cloné cette app en vibe coding, en mettant même un site web et un lien d’achat à environ 60 dollars. C’était une copie tellement flagrante, avec seulement des couleurs différentes et une UI exactement identique, et les conditions de la GPL3 n’étaient pas respectées du tout. Les modérateurs ont retiré le post de la liste et bloqué le développeur de l’app clonée, et la communauté du forum a soutenu le développeur de l’app originale. Une demande de retrait DMCA a aussi été envoyée, et quelques jours plus tard le site du clone a été retiré.
      Le développeur de l’app originale a eu de la chance, parce qu’il n’existe en pratique qu’un seul grand forum où sont postés des contenus sur ce fabricant, et que les modérateurs détestent aussi tout ce qui touche à l’IA. Ironiquement, le développeur de l’app originale avait lui aussi fait tout son travail en vibe coding. Sans ce forum et ses modérateurs, le développeur de l’app originale comme moi, en tant que mainteneur de la bibliothèque GPL3, aurions franchement été fichus.
      La centralisation a des avantages. Sinon, je ne vois pas vraiment d’alternative, à part un mouvement populaire forçant tout le monde à revenir au code source fermé pour lancer une discussion sur le respect du travail d’autrui. Jusqu’ici, on s’appuyait sur un système de réputation et de réaction communautaire.
    • Les juges et les gouvernements sont favorables aux entreprises et hostiles aux consommateurs et aux citoyens.
      Les entreprises prennent l’habitude de pouvoir tout faire sans en subir les conséquences. « Move fast and break things » parlait au départ de technologie, mais c’est devenu une attitude vis-à-vis du droit. Uber a popularisé cette logique, et maintenant tout le monde fait pareil. Le fait que l’IA enfreigne le droit d’auteur fait partie de cette même dynamique.
      Avec cette nouvelle manière de penser selon laquelle la loi est pour les perdants, on risque de traverser une période difficile.
    • Si les plus grands voleurs foncent vers des valorisations de plusieurs milliards, qu’est-ce que tu veux attendre d’autre ?
      Il faut désormais considérer que, sur Internet, tout est de fait à la disposition de tout le monde.
    • Si l’on est convaincu qu’il s’agit d’une course winner-takes-all vers une superintelligence générale, et que celle-ci mènera à une domination absolue du monde, alors on ne va évidemment pas se sentir lié par les lois actuelles, surtout par de simples règles de propriété intellectuelle.
      Parce que la seule manière de perdre à coup sûr, c’est de ne pas participer au jeu.
    • Toute entreprise qui traite des documents de clients externes ou de partenaires utilise une data room comme DocSend by Dropbox pour partager et recevoir des documents avec gestion des accès, analyse et fonctions d’audit.
      Papermark est l’alternative open source à DocSend. On peut l’utiliser en auto-hébergement ou en version hébergée, et c’est bien plus rentable que DocSend, d’où sa popularité.
      Corgi est une startup d’assurance financée par YC, qui vend de l’assurance à d’autres startups YC. Nico en est le fondateur. L’entreprise a récemment levé 100 millions de dollars sur une valorisation d’environ 3 milliards de dollars, et fait actuellement partie des sociétés particulièrement poussées par YC.
      Comme la souscription d’assurances nécessite beaucoup de documents, Corgi payait plusieurs milliers de dollars par mois à DocSend. Pour une raison ou une autre, Corgi semble avoir monté une équipe de 12 personnes pour créer sa propre alternative à DocSend, appelée Dataroom. Et Corgi a décidé d’en faire un produit SaaS sur un marché déjà encombré, en le positionnant comme un DocSend moins cher, à partir de 10 dollars par mois.
      Papermark a immédiatement remarqué que le Dataroom de Corgi reprenait beaucoup de formulations et de structures identiques à son produit open source. Papermark en a donc conclu que Corgi avait repris son travail sans attribution. Corgi le nie, affirmant que les correspondances mot pour mot entre les produits ne sont qu’une simple coïncidence.
      Une autre startup YC, Delve, a en fait fait ce dont Corgi est soupçonné — et bien davantage — avant de se faire prendre et d’être exclue de YC.
  • De ce que je vois, son raisonnement tient grosso modo en deux points :

    1. Le développeur n’a pas copié le code manuellement.
    2. Tous les logiciels d’un même domaine se copient les uns les autres.
      Mais l’indice principal ici, c’est la mise en page et les formulations identiques entre les deux produits. Dire à un LLM « écris ce produit et fais-en une copie 1:1 » reste, selon toute définition de bon sens, une forme de copie. Prétendre que rien n’a été copié n’a aucun sens.
    • Les deux ressemblent visiblement à un boilerplate ShadCN : https://ui.shadcn.com/blocks
      ShadCN est le système de design le plus populaire, celui que l’IA choisit automatiquement dans plus de 90 % des cas, et il est presque utilisé par défaut sur des plateformes comme lovable.
    • C’était, je crois, le cœur de l’affaire Google contre Oracle.
      Google a copié l’API tout en gardant une implémentation en clean room, et cela a finalement été clairement jugé comme relevant du fair use. Si le fair use s’applique à un objet aussi strict que la réimplémentation d’une API, alors on peut considérer qu’il s’applique aussi à des objets bien plus flous comme la copie d’une UI ou d’une mise en page.
    • Ce qu’il affirme, c’est que le code n’a pas été copié.
  • Je ne comprends toujours pas pourquoi des gens utilisent sérieusement ce qui était autrefois Twitter.

  • Même s’ils n’ont pas littéralement copié-collé le code comme ils le disent, il se peut qu’en pratique le LLM ait reproduit le même code à partir des résultats du crawling du dépôt, sans respecter la licence.
    Cela ferait un bon litige civil à faire trancher par un tribunal. Leur défense semble être : « nous avons simplement demandé au LLM de reproduire votre travail, donc ce n’est pas ‘nous’ qui avons copié le code ». Ça sent mauvais.

  • La licence en question : https://github.com/papermark/papermark?tab=License-1-ov-file
    C’est sous AGPL, ce qui signifie en gros que même si des utilisateurs interagissent avec le logiciel via le réseau, le code source doit être publié. Les projets qui utilisent ce code doivent eux aussi être sous AGPL.
    Il existe des moyens de contourner cela en séparant les composants. Par exemple, utiliser un serveur d’authentification sous AGPL ne veut pas dire que le code contenant la logique métier doit aussi être affecté.
    Surtout si l’on avait vu les polémiques passées, il aurait été possible de trouver une manière de concevoir le produit en respectant la licence.
    Cela dit, je pars de l’hypothèse qu’il y a bien eu copie du code, et nous n’en avons pas la certitude. Ça paraît très similaire, mais il est difficile de savoir comment cela serait appliqué en pratique.

    • Pour faire appliquer cela, il faudrait probablement engager une action en justice, et ça semble dépasser largement le seul cas de Corgi
      Les problèmes de droits d’auteur liés à ces modèles sont vraiment un chaos total
  • L’industrie tech fera n’importe quoi pour normaliser le vol et appeler ça de l’innovation

  • C’est la trajectoire typique d’une startup YC