- Des cas ont été signalés où certaines entreprises soutenues par Y Combinator (ci-après YC) ont collecté automatiquement les données d’activité des utilisateurs GitHub pour envoyer des e-mails marketing
- L’auteur du signalement souligne le problème de la réception d’e-mails non sollicités, fondés sur les commits et l’activité des dépôts du profil GitHub
- Il est indiqué que ces e-mails ont été envoyés dans le but de promouvoir un produit ou d’inciter à l’inscription à un service
- Dans la communauté, des critiques ont émergé au sujet de la protection de la vie privée et des pratiques de marketing éthiques
- Cela relance le débat, dans l’écosystème des startups, sur la frontière entre l’usage des données et le consentement des utilisateurs
Collecte des données d’activité GitHub et envoi d’e-mails
- Des cas ont été rapportés où certaines startups liées à YC ont scrapé les données d’activité publique des utilisateurs GitHub afin d’obtenir des adresses e-mail
- L’auteur explique qu’il a reçu un e-mail promotionnel d’une certaine entreprise YC après son activité sur GitHub
- Le contenu de l’e-mail était principalement centré sur la présentation du produit et l’incitation à son utilisation
- Cette pratique est pointée du doigt parce qu’elle constitue un usage de données collectées sans le consentement des utilisateurs
Réaction de la communauté et débat éthique
- Les utilisateurs de Hacker News ont réagi de manière critique, considérant l’envoi d’e-mails sans consentement comme du spam
- Certains affirment que même si les données sont publiques, leur collecte automatisée à des fins marketing est inappropriée
- Le débat s’est élargi à la question de l’équilibre entre les stratégies de croissance des startups et la protection de la vie privée
- Le fait qu’il s’agisse d’entreprises YC a notamment conduit certains à estimer que les attentes en matière de standards éthiques y sont plus élevées
Usage des données et question du consentement
- Les données publiques de GitHub sont accessibles, mais l’idée qu’un consentement explicite est nécessaire en cas d’usage commercial est mise en avant
- La communauté souligne la nécessité de politiques transparentes d’utilisation des données afin de préserver la confiance dans l’écosystème des développeurs
- Cette affaire est perçue comme un signal d’alarme concernant les pratiques d’automatisation marketing des startups
1 commentaires
Commentaires Hacker News
Martin de GitHub ici. Ce type de scraping de données viole clairement les conditions d’utilisation de GitHub
Quand on le détecte, on prend des mesures comme la suspension de comptes. Mais c’est un problème récurrent, un vrai jeu de taupe
Vu la structure de Git, il n’est pas techniquement difficile d’extraire des données depuis des dépôts open source. Les commits contiennent en effet un nom et une adresse e-mail
Nous proposons la fonctionnalité d’adresse
no-replypour que les utilisateurs puissent utiliser une adresse e-mail anonyme lors des commitsLa méthode de configuration détaillée est expliquée dans la documentation officielle
Trouver l’équilibre entre préserver l’ouverture de l’open source et bloquer le spam est difficile. Il existe aussi des limites d’API, mais elles suscitent beaucoup de plaintes. J’aimerais avoir l’avis de la communauté
J’ai signalé un spammeur en juillet 2025, mais je n’ai reçu aucune réponse, et le compte est toujours actif
Si j’ai rendu mon e-mail public, c’était parce que je m’attendais à ce que les règles soient appliquées. Si GitHub laisse les spammeurs tranquilles, il devient difficile de garder des coordonnées publiques
J’ai résumé sur mon blog des cas où des entreprises YC m’ont envoyé du spam sur mon e-mail GitHub
La plupart des utilisateurs ne font pas attention à leur vie privée, donc ce genre de protection serait utile
Du coup, maintenant je ne mets plus d’étoile à aucun dépôt
J’ai reçu le même e-mail moi aussi
C’était un message de l’équipe RunanywhereAI qui présentait un SDK de LLM on-device
En discutant avec l’équipe, j’ai constaté qu’ils prenaient les retours au sérieux et amélioraient rapidement leur SDK Flutter
Ils ont même ajouté une implémentation RAG en une semaine seulement. Au lieu de les critiquer publiquement, ça vaut peut-être le coup d’essayer directement
Je sais que YC a investi dans Flock, mais je me demande ce que recouvre exactement le “problème éthique de YC”
Je fais du marketing auprès des développeurs depuis longtemps, et envoyer du spam sur des adresses GitHub est l’un des pires moyens de faire du marketing
Les cold e-mails adressés aux développeurs ne marchent presque jamais et abîment la confiance dans la marque
C’est complètement différent d’un simple spam automatisé
Si YC demande dans son dossier de candidature si vous avez déjà “hacké le système” pour en tirer profit, ce n’est pas pour rien
C’est parce qu’ils préfèrent des fondateurs capables d’exploiter des zones grises juridiques
Airbnb s’est développé en enfreignant les règles de Craigslist, Reddit a pillé le contenu de Digg, et OpenAI a entraîné ses modèles sur des contenus protégés par le droit d’auteur
Moi aussi, j’ai reçu un e-mail de spam non sollicité de Vincent Jiang chez Aden, une société YC
Il m’invitait à rejoindre une communauté de développement d’agents IA
J’avais classé le premier comme spam, mais j’en ai reçu un autre disant “dernier rappel”
Je n’utiliserai jamais ce genre d’entreprise
Après avoir répondu, il n’a reçu qu’une réponse automatique
Aujourd’hui encore, j’ai reçu du spam sur mon adresse GitHub de Cactus Compute, une société liée à YC
Le message présentait un moteur de modèle vocal on-device et incluait un lien vers le dépôt GitHub cactus-compute/cactus
Ce sujet a déjà été discuté à de nombreuses reprises par le passé
Il y a eu les mêmes discussions il y a 11 ans, il y a 7 ans, il y a 5 ans et il y a 4 ans
C’est un problème chronique qui revient sans cesse
En lisant ce fil, j’ai moi aussi reçu un spam d’un scraper GitHub
L’expéditeur était james@techglobal.website, et le message se faisait passer pour une proposition de collaboration entre ingénieurs basés aux États-Unis
D’après mon expérience, ce genre de message a de fortes chances d’être une tentative d’arnaque nord-coréenne
À noter que ce genre d’e-mails publicitaires non autorisés est illégal en Europe
L’excuse du “je ne savais pas” ne tient pas, car la localisation est souvent indiquée dans les profils GitHub
Une startup qui commence dans l’illégalité part déjà avec un déficit de crédibilité