- De nombreux chercheurs clés de l’équipe Qwen d’Alibaba ont démissionné, ce qui rend incertain l’avenir de la série de modèles Qwen 3.5 récemment dévoilée
- Le chef d’équipe Lin Junyang a annoncé sa démission, suivi par plusieurs membres essentiels de l’équipe
- La famille de modèles Qwen 3.5, lancée récemment, attire d’autant plus l’attention qu’elle affiche d’excellentes performances même sur les petits modèles
- La possible dislocation de l’équipe Qwen pourrait constituer un tournant majeur pour l’écosystème chinois de recherche en IA open source
Changements de personnel au sein de l’équipe Qwen
- Juste après la publication de la série de modèles Qwen 3.5 d’Alibaba, le chef d’équipe Lin Junyang a annoncé sa démission sur X (anciennement Twitter) avec le message : « me stepping down. bye my beloved qwen. »
- Lin était, depuis 2024, un chercheur clé ayant mené la publication des modèles à poids ouverts de Qwen, et faisait partie des plus jeunes employés de niveau P10 chez Alibaba
- Selon un article du média chinois 36Kr, le Tongyi Lab d’Alibaba a convoqué vers 13 h le 4 mars une réunion d’urgence à l’échelle de l’entreprise, au cours de laquelle le CEO Wu Yongming a expliqué directement la situation à l’équipe Qwen
- La démission de Lin avait été annoncée 12 heures plus tôt, à 0 h 11, et aurait aussi provoqué un choc important en interne
- Vers 14 h, Lin a laissé sur WeChat le message : « Frères de Qwen, continuez comme prévu. Pas de problème », sans préciser clairement s’il comptait revenir
- Des membres de l’équipe Qwen ont déclaré à 36Kr que « dans un contexte de ressources bien inférieures à celles des concurrents, le leadership de Junyang a été un facteur clé des résultats actuels »
- Parmi les éléments avancés pour expliquer cette démission figure une réorganisation interne chez Alibaba, dans laquelle un nouveau chercheur issu de l’équipe Google Gemini aurait été placé à la tête de Qwen, mais cette information n’est pas confirmée
Départs en chaîne de membres clés
- Après la démission de Lin, plusieurs membres clés ont également quitté l’équipe
- Binyuan Hui : responsable du développement du code de Qwen, en charge de la série Qwen-Coder, du cycle complet d’apprentissage des agents, et récemment impliqué dans la recherche en robotique
- Bowen Yu : responsable du post-training de Qwen, à la tête du développement de la série Qwen-Instruct
- Kaixin Li : contributeur majeur à Qwen 3.5/VL/Coder, docteur de l’Université nationale de Singapour
- En plus d’eux, plusieurs jeunes chercheurs auraient démissionné le même jour
- Le fait que le CEO d’Alibaba ait personnellement participé à la réunion montre que l’entreprise est consciente de la gravité de la situation
Caractéristiques du modèle Qwen 3.5
- Qwen 3.5 est une famille de modèles à poids ouverts publiée ces dernières semaines par l’équipe Qwen d’Alibaba, avec des performances très élevées
- Qwen3.5-397B-A17B, publié le 17 février, est un grand modèle de 807 GB
- Ont ensuite été publiés successivement des modèles de tailles 122B, 35B, 27B, 9B, 4B, 2B et 0.8B
- Les modèles 27B et 35B sont bien évalués en code, et les modèles 9B, 4B et 2B sont très efficaces au regard de leur taille
- Les modèles 27B et 35B peuvent tourner sur des Mac 32 GB/64 GB tout en traitant très bien les tâches de programmation
- En particulier, le modèle 2B ne pèse que 4.57 GB (1.27 GB une fois quantifié), tout en prenant en charge à la fois le raisonnement et les capacités multimodales (vision)
Perspectives
- Si l’équipe Qwen est dissoute, il est possible que les travaux ayant permis d’obtenir des performances de haute qualité sur de petits modèles soient interrompus
- Si les membres de l’équipe fondent un nouveau laboratoire ou rejoignent d’autres institutions, les attentes autour de recherches de suivi restent fortes
- La situation reste pour l’instant « encore incertaine », et Alibaba pourrait aussi conserver une partie des effectifs
Sources externes citées
Aucun commentaire pour le moment.