Quitter Meta et PyTorch

(soumith.ch)

7 points par GN⁺ 2025-11-08 | 1 commentaires | Partager sur WhatsApp

Soumith Chintala, qui dirigeait PyTorch depuis environ 8 ans, a annoncé quitter Meta et PyTorch après 11 ans dans l’entreprise
PyTorch prend désormais en charge l’apprentissage à l’échelle exascale et a accompli un large éventail de résultats, notamment l’exploitation de modèles de base et son utilisation dans l’enseignement à travers le monde
Il estime que PyTorch a atteint une maturité suffisante pour fonctionner de manière indépendante et se dit confiant dans la stabilité de l’équipe de succession
Il exprime sa gratitude et ses réflexions rétrospectives sur la collaboration avec ses collègues depuis l’époque de FAIR, la culture open source et la croissance de la communauté d’utilisateurs
À titre personnel, il prévoit de lancer un petit projet en dehors de Meta pour relever de nouveaux défis

Adieu à Meta et à PyTorch

Après 11 ans chez Meta et environ 8 ans à la tête de PyTorch, il a permis d’atteindre un taux d’adoption de plus de 90 % dans l’industrie de l’IA
- PyTorch prend désormais en charge l’apprentissage à l’échelle exascale et fait tourner des modèles de base qui redéfinissent l’intelligence
- Il est utilisé dans l’enseignement, du MIT jusqu’aux zones rurales de l’Inde, et l’objectif d’amélioration de l’accessibilité est presque atteint
Il souligne que, malgré la rapidité des progrès de l’IA et la nécessité pour PyTorch de continuer à évoluer, le projet a déjà accompli énormément
Il remercie tous ceux qui ont cru à la force de l’open source et à une culture de recherche joyeuse
Il aurait pu rejoindre un autre poste en interne chez Meta, mais a choisi de partir à l’extérieur par goût du défi et curiosité
Il conclut son texte par le message « Rendons l’IA savoureuse et accessible » et affirme son intention de continuer à participer à la communauté

La stabilité future de PyTorch

Il n’a jamais voulu rester indéfiniment à la tête de PyTorch et s’était fixé pour objectif de partir alors que le projet est dans un état stable
- Il a commencé à préparer son départ fin 2024 et, en août 2025, il était convaincu que l’équipe pouvait fonctionner de manière autonome
Des personnes clés comme Edward, Suo, Alban, Greg, John, Joe et Jana résolvent de façon autonome les problèmes produit et organisationnels
Il met en avant la résilience de l’organisation, en s’appuyant sur la cohérence du récit produit lors de la PyTorch Conference et sur l’amélioration des problèmes passés
Greg, Alban, Ed, Jason et Joe perpétuent les valeurs et la culture de PyTorch, et de nombreuses autres personnes partagent cet alignement de valeurs
Il mentionne en détail les compétences techniques et l’expérience de collaboration de John, Suo et Jana, exprimant sa confiance dans la pérennité de l’équipe

Son passage chez Meta

Il se souvient des débuts de FAIR comme d’une « période magique », durant laquelle il a participé à divers projets, dont la recherche sur les GAN, un bot Starcraft, la construction du cluster FAIR, la détection d’objets et le développement de PyTorch
Il considère la période 2015-2016 comme la plus productive et la plus agréable
Il mentionne l’aide déterminante apportée par le mentorat d’Andrew Tulloch à ses débuts dans l’entreprise

Le parcours de développement de PyTorch

Il a participé directement à toutes les étapes de PyTorch — conception, gestion, documentation, déploiement — et l’a vu devenir un produit porté par des centaines de personnes
Il remercie les ingénieurs, chercheurs, contributeurs open source, rédacteurs de documentation et partenaires hardware, chez Meta comme en dehors
Il cite de nombreuses figures clés, dont Adam Paszke, Sam Gross, Greg Chanan, Joe Spisak, Alban Desmaison et Edward Yang
Il se souvient d’un étudiant en master qui, à NeurIPS 2017, lui avait raconté avoir pu terminer sa recherche grâce à PyTorch, ce qui lui a fait prendre la mesure de l’impact sur les utilisateurs
La PyTorch Conference est passée d’une réunion familiale d’environ 300 personnes à un événement industriel de 3 000 participants, et il exprime sa fierté face à cette influence élargie

Remerciements

Il explique que FAIR et PyTorch ont été rendus possibles grâce au soutien de Mark Zuckerberg et Mike Schroepfer à la stratégie open source
Il remercie Yann LeCun et Rob Fergus pour la mise en place initiale de FAIR
Il fait l’éloge du leadership technique et de la capacité d’exécution d’Aparna Ramani
Il mentionne l’accueil et la coopération de l’équipe infrastructure, notamment Santosh, Kaushik, Delia, Oldham et Ben
Il remercie également des managers comme Serkan, Howard, Jerome, Abhijit, Yoram, Joelle, Aparna et Damien

Mot de la fin

Il insiste sur le fait que « ce n’était pas mon parcours, mais notre parcours », soulignant l’ampleur de l’accomplissement collectif
Il indique qu’il va désormais essayer de faire « des choses petites, nouvelles et inconfortables »
Il laisse à la communauté PyTorch un message d’encouragement : « Continuez à rendre l’IA savoureuse et simple »

1 commentaires

GN⁺ 2025-11-08

Discussion sur Hacker News

Beaucoup de commentaires semblent juger PyTorch a posteriori. Mais quand Soumith Chintala a co-créé PyTorch, il n’existait pratiquement pas d’environnement de développement rapide et interactif. JAX n’existait même pas.
À l’époque, tous les chercheurs qui essayaient PyTorch voulaient passer dessus immédiatement, tellement c’était meilleur. Andrej Karpathy avait même écrit dans un tweet en 2017 : « J’utilise PyTorch depuis quelques mois et ça a changé ma vie » (lien vers le tweet).
Merci à Soumith pour ses années d’engagement sans faille, et bonne chance pour la suite de son parcours
- Chainer avait déjà introduit le modèle define-by-run. C’était un framework développé par une petite entreprise japonaise, et les premières versions de PyTorch reconnaissaient explicitement avoir été fortement influencées par Chainer
- PyTorch s’est inspiré de la bibliothèque Python Autograd vers 2015. D’ailleurs, le système de différentiation automatique de PyTorch s’appelait lui aussi autograd. JAX est le successeur direct d’Autograd, et certains de ses développeurs travaillent encore aujourd’hui dans l’équipe JAX. Adam Paszke, co-auteur de PyTorch, participe lui aussi actuellement aux projets JAX et Dex (historique d’Autograd, archive de présentation de PyTorch)
Je fais partie des personnes recrutées directement par Soumith chez Meta et PyTorch pour travailler avec lui.
Soumith a toujours considéré PyTorch comme un projet centré sur la communauté. Il célébrait les contributions de chacun, non seulement celles des co-créateurs Adam et Sam, mais aussi lors de l’intégration avec l’équipe Caffe2.
Dès le départ, PyTorch a été conçu comme un framework ouvert pour la communauté de recherche, et Soumith a constamment encouragé de nouvelles personnes et organisations à y participer au fil de sa croissance.
C’était un véritable aimant à talents, et grâce à lui d’innombrables personnes brillantes ont investi leur passion pour faire avancer PyTorch.
Même maintenant qu’il s’en va, PyTorch a atteint un niveau de maturité qui lui permet de très bien se tenir debout tout seul. C’est précisément à cela que ressemble le succès de l’open source
- J’ai aussi travaillé avec Soumith, et c’est vraiment une figure légendaire. Un leader capable de provoquer d’immenses changements tout en restant humble, peu politique et en faisant grandir les gens autour de lui. Je lui souhaite sincèrement le meilleur
Ce qui est intéressant ici, c’est que cela ressemble à un signal montrant que Meta ne possède pas d’actifs propriétaires liés à l’IA.
Cela rappelle un peu le mythe selon lequel la recherche militaire serait très en avance sur la réalité.
Au final, on dirait que les laboratoires IA des big tech répètent eux aussi des choses pas si différentes, sans technologie secrète particulière
- C’est sans doute une interprétation excessive. Soumith a travaillé 11 ans chez Meta et a probablement déjà reçu une solide rémunération en actions. Il a aussi eu un enfant récemment, et l’équilibre vie pro-vie perso chez Meta n’est pas réputé bon.
  De plus, Meta est récemment en train de se recentrer sur les LLM, ce qui réduit le rôle historique de PyTorch. Vu sous cet angle, cela ressemble simplement à un moment naturel pour changer de poste
- Les technologies militaires sont souvent en réalité en retard sur le civil. Le secret freine la collaboration, et les facteurs politiques rendent l’ensemble plus inefficace
- Le départ de Soumith ne semble pas lié à l’originalité de l’IA de Meta. C’est simplement le moment où il a eu envie de changement.
  Même face aux discours actuels sur l’arrivée imminente de l’« AGI », les développeurs en interne ne paraissent pas particulièrement surexcités. Le retour de Karpathy vers l’enseignement ou la création de startup par Mira Murati vont dans le même sens
- Il a simplement dit vouloir se concentrer sur de petites choses. On ne sait même pas si son nouveau projet sera lié à l’IA
- Quiconque a déjà manipulé du matériel militaire le sait : ce qu’on appelle la « technologie militaire de pointe » est souvent surtout de la vieille technologie éprouvée assemblée avec des composants bon marché. Comme les Raspberry Pi utilisés dans des drones russes, la réalité est souvent étonnamment banale
La passion de Soumith était contagieuse. J’avais expérimenté avec Lua Torch après avoir lu l’article sur DCGAN, et cela fonctionnait bien même sur le petit jeu de données Oxford flowers.
Soumith avait été suffisamment impressionné pour partager le résultat sur les réseaux sociaux.
À l’époque, PyTorch et Lua Torch étaient bien plus faciles à utiliser que TensorFlow, et le code avait une structure facile à bidouiller, ce qui permettait aux chercheurs d’expérimenter librement
- Un commentaire demandait ce qu’était le jeu de données Oxford flowers et où le trouver
Parmi les propos de Soumith, la phrase « quelque chose de petit et de nouveau, quelque chose que je ne comprends pas encore complètement, quelque chose d’inconfortable » a marqué les esprits.
Il aurait pu faire autre chose chez Meta, mais il a choisi de suivre cette curiosité qui l’obligeait à sortir. On dirait presque « Siddhartha retournant dans la forêt »
- Je suis d’accord avec l’expression de « l’ombre de Siddhartha », mais en même temps c’est aussi quelqu’un qui cherche simplement à prendre du recul après avoir travaillé dans une mégacorp aux effets sociaux considérables
En tant qu’utilisateur de JAX, je respecte le succès de PyTorch. Après les erreurs de TensorFlow 1, PyTorch a dominé l’écosystème de l’IA.
J’espère que Matt Johnson sera un jour autant salué que Soumith pour avoir fait évoluer Autograd vers JAX
- Un commentaire demandait pourquoi TensorFlow était considéré comme un échec
- Un autre demandait aussi s’il y avait une expérience concrète avec JAX et PyTorch, et pourquoi JAX était préféré
- JAX est excellent, mais il y a une inquiétude autour de l’instabilité des projets chez Google. Il existe toujours un risque qu’il soit remplacé du jour au lendemain par une version incompatible façon JAX 2.0
La bibliothèque sous-jacente de Torch est elle aussi un outil vraiment agréable à utiliser. En Rust, il existe des bindings comme tch et Burn, qui s’intègrent bien avec libtorch.
L’un des grands avantages de PyTorch est la possibilité de faire du débogage dynamique. On pouvait interrompre un modèle directement dans le terminal et inspecter son état interne, et cette expérience me manque encore
- Cela m’a aussi conduit à écrire beaucoup de code affreux à l’époque, mais c’était vraiment une époque glorieuse
Sa phrase disant que « toutes les grandes entreprises de l’IA et tous les fournisseurs de matériel pouvaient le contacter, mais qu’au final la curiosité l’a emporté » m’a marqué.
J’espère qu’il construira encore une fois un nouvel outil puissant
- Quand la curiosité disparaît, tout s’effondre. Je connais bien ce sentiment.
  J’ai moi aussi traversé une période où j’ai dû faire pendant longtemps un travail vide de sens pour gagner ma vie, alors je l’envie un peu de pouvoir prendre une telle décision
La phrase disant que « PyTorch est enseigné du MIT jusqu’à des salles de classe rurales en Inde » m’a marqué.
Cela donne presque l’impression que certaines salles de classe en Inde sont peut-être meilleures en accessibilité pédagogique et en pratique que les écoles d’ingénieurs d’élite américaines
- Les « écoles d’ingénieurs d’élite » américaines sont en réalité souvent valorisées surtout pour leur statut social et leurs résultats en recherche, alors que la qualité de l’enseignement peut être médiocre
- À l’inverse, l’enseignement traditionnel en Inde est critiqué pour son apprentissage par cœur et son obsession des examens. Certains faisaient remarquer que les écoles d’ingénieurs américaines ne sont pas parfaites, mais que les problèmes du système éducatif indien restent eux aussi bien réels
En tant qu’utilisateur quotidien de PyTorch, je tiens à adresser mes remerciements sincères à Soumith et à l’équipe.
Grâce à cet outil, j’ai pu expérimenter directement des idées que je n’aurais auparavant fait qu’imaginer.
PyTorch a occupé une grande place dans ma vie, et je lui souhaite toute la réussite possible pour la suite

Quitter Meta et PyTorch

Adieu à Meta et à PyTorch

La stabilité future de PyTorch

Son passage chez Meta

Le parcours de développement de PyTorch

Remerciements

Mot de la fin

À lire aussi

1 commentaires

Discussion sur Hacker News