- Huawei est visé par des révélations internes affirmant que l’entreprise aurait copié de grands modèles d’IA de Qwen et DeepSeek, puis les aurait présentés comme son propre produit sous le nom de « Pangu »
- Selon le témoignage d’un employé interne de l’équipe Pangu, certains modèles clés n’auraient pas été réellement développés en interne, mais simplement renommés à partir de modèles open source externes
- D’un point de vue technique, il apparaît que des modèles majeurs comme 135B V2 et Pro MoE 72B correspondent dans une large mesure à l’architecture de Qwen et DeepSeek
- En interne, ces pratiques auraient entraîné une baisse du moral des chercheurs et des départs, aggravés aussi par l’inefficacité administrative et des politiques RH opaques
- Il existerait bien de véritables modèles développés de manière autonome (comme Pangu V3), mais la pratique du clonage et une culture de recherche peu reconnue auraient profondément entamé la confiance dans l’organisation
- Le lanceur d’alerte dit avoir décidé de révéler la vérité sous son vrai nom et appelle l’organisation à l’introspection et au changement
La tragédie de Pangu : les coulisses douloureuses du grand modèle Pangu chez Huawei Noah Ark Lab
Présentation du lanceur d’alerte et ambiance sur le terrain
- L’auteur indique appartenir à l’équipe des grands modèles Pangu de Huawei Noah, et affirme avoir authentifié son identité en la recoupant avec des informations internes sur la structure organisationnelle, les projets et la composition du leadership
- Le projet Pangu ressemblait en réalité davantage à une organisation de livraison qu’à une organisation de recherche, sous pression permanente de délais répétés, de surcharge de travail, d’évaluations et de reporting continus
- L’intensité du travail et la bureaucratie y étaient extrêmes, avec des périodes prolongées loin de la famille, en logement de fonction, et du travail fréquent le week-end
- En pratique, l’autonomie et la créativité de la recherche passaient après une culture d’entreprise centrée sur les délais et les résultats des différentes lignes produits (Cloud, ICT, etc.)
Des nuits sans sommeil, une conscience créative piétinée
- Après la controverse sur le plagiat du modèle Qwen, certains chercheurs disent avoir ressenti simultanément honte, colère et impuissance
- Le lanceur d’alerte affirme craindre les représailles d’un géant industriel et de ses réseaux internes, mais dit ne plus pouvoir tolérer la dissimulation des faits et la communication mensongère vers l’extérieur, d’où sa décision de parler par conscience
Des obstacles techniques, puis le début du plagiat
- Les premiers modèles Pangu ont tenté un entraînement maison sur des NPU Ascend de Huawei, mais ont connu de graves tâtonnements, notamment en raison de l’inefficacité du tokenizer et de performances insuffisantes du modèle
- L’équipe a pris du retard sur des concurrents (Alibaba, Zhipu) utilisant des modèles sur GPU, et l’entraînement de son propre modèle dense 230B s’est soldé par un échec
- Par la suite, le laboratoire des petits modèles l’aurait présenté comme du « développement interne », alors qu’il aurait en réalité produit un 135B V2 cloné et légèrement modifié à partir du modèle Qwen-1.5 (110B), avec des similarités de code et d’architecture visibles même en interne
- Les principaux dirigeants et membres du management auraient été au courant de cette réalité, mais l’auraient tolérée au nom de la pression exercée sur les résultats et les performances externes
Une véritable réussite technique : Pangu V3
- Après de nombreux efforts, l’équipe a entraîné de manière indépendante sur Ascend un modèle Pangu V3 (135B Ultra) entièrement développé en interne dès le départ
- En surmontant plusieurs difficultés techniques (unification du tokenizer, stabilisation de la courbe de perte, etc.), elle serait parvenue à des performances comparables à celles de concurrents
- Cette réussite constituait, selon le texte, la preuve d’un développement autonome de grand modèle plutôt que d’un plagiat, et une source de fierté pour les chercheurs
Le travail ingrat derrière la division des tâches
- Le laboratoire des petits modèles aurait continuellement récupéré données, code et résultats pour modifier et diffuser facilement des modèles, tandis que les résultats et les récompenses revenaient surtout à cette entité
- De ce fait, des chercheurs très investis auraient quitté l’organisation ou décriraient cette période avec amertume comme une tache dans leur parcours technique
Cas secondaire de plagiat : clone 224B MoE / 718B
- Lors du développement d’un nouveau modèle 718B MoE, DeepSeekv3 aurait été quasiment copié tel quel puis renommé Pangu Pro MoE 72B avant diffusion
- En interne, ces pratiques auraient été connues, mais le climat aurait été dominé par la peur pour sa survie professionnelle et la peur de révéler la vérité
Une gestion administrative absurde
- Les véritables chercheurs étaient soumis à des processus stricts, à une traçabilité des lignées de modèles et à des mécanismes d’audit, ce qui ralentissait le développement
- Mais pour les modèles clonés, un double standard profondément enraciné persistait : « si cela vient d’en haut, tout passe »
Les raisons de la révélation et la décision de démissionner
- Après l’affaire HonestAGI, l’entreprise aurait lancé une gestion de crise et des tentatives de dissimulation interne
- Le lanceur d’alerte affirme ne plus pouvoir participer à de « faux rapports » ni à une entente interne, et dit avoir demandé le retrait de son nom des listes d’équipe et des rapports, tout en exprimant son intention de quitter volontairement l’entreprise
Dernier appel et attachement aux collègues
- De nombreux collègues sont déjà partis chez ByteDance, DeepSeek, Tencent, Kuaishou et d’autres entreprises, illustrant selon lui une grave fuite des talents chez Huawei
- Il souligne qu’avec de l’innovation, un environnement adapté et moins d’obstacles politiques, il aurait été possible de développer des grands modèles et des puces de niveau mondial
- Il dit être prêt à assumer l’authenticité de ses propos, y compris le risque de menaces contre lui-même et sa famille en raison d’éventuelles révélations supplémentaires
Éléments contextuels supplémentaires
- Dans le cas du clone 135B V2, le laboratoire des petits modèles aurait récolté les bénéfices, comme les récompenses et incitations, tandis que la charge du support downstream et de la maintenance était reportée sur l’équipe de développement d’origine (4th brigade)
- Même dans la liste des auteurs du rapport technique de Pangu, des personnes ayant contribué de façon décisive au développement du modèle auraient été exclues, tandis que des membres non contributeurs du laboratoire des petits modèles y auraient été inclus, signe selon le texte de pratiques académiques injustes très répandues
1 commentaires
Avis Hacker News