Leçons tirées de l’intérieur des laboratoires d’IA chinois

(interconnects.ai)

11 points par GN⁺ 5 시간 전 | 2 commentaires | Partager sur WhatsApp

Rapport de terrain fondé sur des visites directes dans les principaux laboratoires d’IA chinois et des échanges avec des chercheurs, analysant les différences culturelles entre les écosystèmes IA chinois et américain et leur impact sur le développement des modèles
Les chercheurs chinois montrent une culture davantage tournée vers l’optimisation de la qualité du modèle final que vers la réputation individuelle, et une part importante des contributeurs clés sont encore étudiants
Les entreprises chinoises d’IA ont un fort réflexe de propriété visant à contrôler leur propre stack technique plutôt qu’à acheter des services externes, et leurs publications open source reposent aussi sur un calcul pragmatique
La plupart des développeurs IA chinois utilisent Claude, et la demande d’IA en entreprise pourrait suivre une trajectoire plus proche du cloud que du SaaS
Les écosystèmes IA américain et chinois fonctionnent selon des logiques structurellement différentes, et cartographier trop simplement l’industrie chinoise de l’IA avec un cadre occidental peut conduire à une erreur de catégorie

La manière de penser des chercheurs chinois

Les entreprises chinoises qui développent des LLM combinent de longues traditions culturelles issues de l’éducation et du travail avec des nuances propres à l’exploitation des entreprises technologiques, ce qui leur donne une structure idéale comme fast followers
Construire un LLM de pointe aujourd’hui repose sur un travail minutieux sur l’ensemble de la stack — données, détails d’architecture, implémentation des algorithmes de RL, etc. — dans un processus complexe où les résultats d’un contributeur individuel doivent parfois s’effacer au profit de l’optimisation multi-objectif du modèle global
Les chercheurs américains évoluent dans une culture où l’on promeut fortement son propre travail, et la quête d’une réputation de « scientifique de premier plan en IA » génère des frictions internes
- Il circule largement la rumeur que l’organisation Llama s’est effondrée sous le poids de ces intérêts politiques internes
- On entend aussi des histoires selon lesquelles certains laboratoires auraient dû verser des compensations à des chercheurs vedettes mécontents que leurs idées n’aient pas été retenues dans le modèle final
Une part importante des contributeurs clés dans les laboratoires chinois sont des étudiants encore en cursus, et ces laboratoires sont eux-mêmes des organisations très jeunes
- Cela ressemble à la structure d’Ai2, où les étudiants sont traités comme des pairs et intégrés directement aux équipes LLM
- À l’inverse, OpenAI, Anthropic, Cursor et d’autres aux États-Unis n’offrent pas de stages, et même les stages liés à Gemini chez Google risquent d’être déconnectés du travail réel
Ces différences culturelles améliorent concrètement la capacité à construire des modèles de plusieurs façons :
- une forte acceptation des tâches peu valorisées si elles améliorent le modèle final
- des nouveaux venus en IA moins prisonniers des précédents cycles de hype, donc plus aptes à s’adapter rapidement aux techniques modernes
- moins d’ego, donc une structure organisationnelle un peu plus scalable, avec moins de comportements de contournement du système
- un vaste vivier de talents bien adapté à la résolution de problèmes déjà validés conceptuellement ailleurs
Ces atouts contrastent avec le stéréotype bien connu selon lequel les chercheurs chinois produiraient moins de recherche académique créative et pionnière de type 0-to-1
- Les responsables des laboratoires académiques essaient de cultiver une culture de recherche plus ambitieuse
- Certains leaders techniques restent sceptiques, estimant que repenser les systèmes éducatifs et d’incitation serait une tâche trop vaste dans l’équilibre économique actuel

Les caractéristiques des chercheurs étudiants

Comme aux États-Unis, la Chine connaît aussi une forme de fuite des cerveaux, et beaucoup de personnes qui auraient auparavant envisagé l’université cherchent désormais à rester dans l’industrie
- Un chercheur a expliqué qu’il s’intéressait à un poste de professeur, mais que « l’enseignement est résolu par les LLM — pourquoi un étudiant viendrait-il me poser une question ? »
Les étudiants ont l’avantage d’aborder les LLM sans idées préconçues
- Ces dernières années, le paradigme central des LLM a évolué de la mise à l’échelle des MoE → la mise à l’échelle du RL → l’usage d’agents
- Pour bien suivre tout cela, il faut absorber très vite un large contexte documentaire et technique, une tâche à laquelle les étudiants sont habitués et qu’ils abordent avec enthousiasme
Les chercheurs étudiants chinois sont moins engagés dans les débats philosophiques et vont très directement au but
- Les chercheurs chinois ayant des opinions élaborées sur l’économie des modèles ou les risques sociaux de long terme sont beaucoup plus rares qu’aux États-Unis
- Un chercheur a cité la formule célèbre de Dan Wang : « la Chine est dirigée par des ingénieurs, les États-Unis par des avocats »
- Il n’existe pas en Chine de filière équivalente aux podcasts ultra grand public comme ceux de Dwarkesh ou Lex, qui contribuent systématiquement à construire le star-system des scientifiques
Face aux questions sur l’incertitude économique créée par l’IA, sur ce qui vient au-delà de l’AGI, ou sur les débats moraux autour du comportement des modèles, les scientifiques chinois reflètent les traits d’un système où les opinions sur le débat et l’organisation sociale ne sont pas encouragées

L’ambiance sur le terrain à Pékin et dans l’écosystème IA chinois

Pékin donne une impression très proche de la Bay Area, avec des laboratoires concurrents situés à distance de marche ou de court trajet
- En 36 heures, visites de Z.ai, Moonshot AI, l’université Tsinghua, Meituan, Xiaomi et 01.ai
- Les déplacements en Didi sont pratiques, et les catégories XL sont souvent des minivans électriques avec sièges massants
La guerre des talents entre chercheurs ressemble beaucoup à celle des États-Unis : changer de laboratoire est courant, et le critère de choix est souvent l’endroit où l’ambiance est la meilleure du moment
La communauté chinoise des LLM ressemble davantage à un écosystème qu’à des tribus concurrentes
- Tous les laboratoires chinois se méfient de ByteDance, qui possède le populaire modèle Doubao
- ByteDance est le seul laboratoire frontier fermé en Chine
- Tous les laboratoires respectent DeepSeek comme le leader technique ayant le meilleur instinct d’exécution
- Cela contraste avec les États-Unis, où rencontrer officieusement des membres de laboratoires différents produit vite des étincelles
L’un des aspects les plus frappants de l’humilité des chercheurs chinois est leur désintérêt pour l’aspect business, avec l’idée que « ce n’est pas leur problème »
- Aux États-Unis, tout le monde est obsédé par les tendances industrielles à l’échelle de l’écosystème : vendeurs de données, compute, financement, etc.

Différences et similitudes de l’industrie chinoise de l’IA

Aujourd’hui, construire des modèles d’IA ne se réduit plus à un résultat d’ingénierie produit par d’excellents chercheurs : c’est une activité composite où se mêlent construction, déploiement, financement et adoption
Six grandes différences avec l’écosystème occidental :
1. Premiers signes de demande domestique en IA
- Il existe l’hypothèse selon laquelle les entreprises chinoises ne paient pas pour les logiciels, ce qui empêcherait l’émergence d’un gigantesque marché de l’inférence
- Cela n’est historiquement vrai que pour le petit écosystème SaaS chinois ; la Chine dispose malgré tout d’un vaste marché du cloud
- La grande question non résolue : les dépenses d’IA en entreprise suivront-elles le marché du SaaS (petit) ou celui du cloud (fondamental) ?
- Globalement, l’IA semble suivre une trajectoire plus proche du cloud, et personne ne paraissait vraiment inquiet de voir un marché se développer autour de ces nouveaux outils
2. La plupart des développeurs utilisent Claude
- La majorité des développeurs IA chinois sont enthousiastes à propos de Claude et se concentrent sur la manière dont il a transformé la façon de construire des logiciels
- Claude est utilisé alors même qu’il est nominalement interdit en Chine
- Certains chercheurs mentionnent des outils maison comme Kimi ou GLM CLI, mais tous mentionnent aussi Claude
- Il y a eu étonnamment très peu de références à Codex, pourtant en forte progression dans la Bay Area
- Même si la Chine a historiquement été réticente à acheter du logiciel, cela ne donne pas l’impression qu’une explosion de la demande d’inférence soit improbable
3. Le réflexe de propriété technologique
- La culture chinoise combinée à une économie très dynamique produit des résultats difficiles à prévoir
- Beaucoup de modèles d’IA reflètent non pas un master plan, mais l’équilibre pragmatique et actuel de nombreuses entreprises technologiques
- L’industrie respecte ByteDance et Alibaba comme des incumbents appelés à gagner sur la plupart des marchés grâce à leurs ressources considérables
- DeepSeek est un leader technique respecté, mais reste à distance du leadership de marché : il donne le cap sans être structuré pour gagner économiquement
- Voir des entreprises comme Meituan (livraison) ou Ant Group construire des modèles peut surprendre en Occident, mais le raisonnement est que les LLM seront au cœur des produits technologiques futurs et exigent donc une base solide
- Fine-tuner un modèle généraliste permet de renforcer la stack grâce aux retours de la communauté open et de conserver en interne des versions fine-tunées pour ses propres produits
- La logique « open d’abord » repose sur le pragmatisme : obtenir des retours solides sur le modèle, contribuer à la communauté open source et renforcer la mission
4. Le soutien public existe, mais son ampleur reste floue
- On affirme souvent que le gouvernement chinois soutient activement la compétition autour des LLM ouverts
- Le gouvernement est décentralisé à plusieurs niveaux, et il n’existe pas de playbook clair sur ce que fait exactement chaque échelon
- Les quartiers de Pékin sont en concurrence pour attirer les bureaux des entreprises technologiques
- L’« aide » fournie inclut presque certainement la simplification de procédures bureaucratiques comme les autorisations, mais il n’est pas clair si cela va jusqu’à l’attraction de talents ou à la contrebande de puces
- Plusieurs allusions à l’intérêt ou à l’aide de l’État ont été entendues pendant la visite, mais elles sont trop insuffisantes pour en rendre compte de façon catégorique
- Rien n’indiquait que le plus haut niveau du gouvernement chinois influence les décisions techniques sur les modèles
5. Une industrie de la donnée bien moins développée
- Sachant qu’Anthropic et OpenAI dépenseraient plus de 10 millions de dollars pour un seul environnement, et des centaines de millions par an pour l’extension frontier du RL, l’objectif était de vérifier si les laboratoires chinois achetaient les mêmes environnements à des entreprises américaines ou s’appuyaient sur un écosystème local
- Ce n’est pas tant que l’industrie de la donnée n’existe pas, mais elle est relativement moins qualitative, au point qu’il vaut souvent mieux construire soi-même ses environnements ou ses données
- Les chercheurs consacrent eux-mêmes beaucoup de temps à construire des environnements d’entraînement RL
- De grands groupes comme ByteDance et Alibaba disposent d’équipes internes d’annotation de données pour soutenir cet effort
- Tout cela reflète la logique déjà évoquée du construire plutôt qu’acheter
6. Une demande urgente pour les puces Nvidia
- Le compute Nvidia reste le gold standard pour l’entraînement, et tous les laboratoires voient leur progression limitée par sa pénurie
- S’il y avait davantage d’offre, ils achèteraient clairement
- D’autres accélérateurs, notamment ceux de Huawei, sont bien évalués pour l’inférence, et de nombreux laboratoires ont accès à des puces Huawei
Ces éléments dressent le portrait d’un écosystème IA très différent, où appliquer trop vite les modes de fonctionnement occidentaux à la Chine conduit à une erreur de catégorie
La question centrale est de savoir si ces écosystèmes différents produiront des types de modèles réellement différents, ou si les modèles chinois continueront d’être décrits comme des versions américaines frontier avec 3 à 9 mois de décalage

Équilibre mondial

La Chine n’est pas un pays que l’on peut réduire à des règles ou à une recette ; elle obéit à des dynamiques et une chimie très différentes
- Sa culture est très ancienne et profonde, et totalement entremêlée à sa manière de construire de la technologie au niveau national
La structure actuelle du pouvoir aux États-Unis fait de la vision du monde sur la Chine un dispositif central de décision, mais la Chine possède des qualités et des instincts très difficiles à modéliser avec les cadres décisionnels occidentaux
Même lorsqu’on demande directement à ces laboratoires pourquoi ils publient leurs meilleurs modèles en open, l’intersection entre réflexe de propriété et véritable soutien de l’écosystème reste difficile à relier clairement
Presque toutes les grandes entreprises technologiques chinoises construisent leur propre LLM généraliste
- Meituan (livraison), Xiaomi (grand groupe de tech grand public), etc., publient des modèles à poids ouverts
- Leurs équivalents américains achèteraient simplement un service
- Si ces entreprises construisent des LLM, ce n’est pas pour suivre une mode, mais par volonté profonde de contrôler leur propre stack et de développer la technologie la plus importante de l’époque
L’humanité, le charme et la chaleur sincère des chercheurs chinois constituent une expérience très humaine
- Les conversations géopolitiques dures qui dominent souvent aux États-Unis ne semblaient pas les atteindre du tout
Si l’écosystème open prospère à l’échelle mondiale, il pourra produire une IA plus sûre, plus accessible et plus utile ; la question actuelle est de savoir si les laboratoires américains prendront les mesures nécessaires pour occuper cette position de leadership
Des rumeurs de décrets présidentiels affectant les modèles open circulent de plus en plus, ce qui pourrait encore compliquer la synergie entre le leadership américain et l’écosystème mondial

2 commentaires

jjw9512151 6 분 전

Parfois, je crains qu’une obsession excessive et irrationnelle à l’égard de la Chine
ne soit en train de créer le monstre qui sommeille en nous.

Comme lorsque l’anticommunisme était l’un des arguments ayant servi à légitimer l’arrivée au pouvoir des nazis.

kaydash 15 분 전

Une seule Chine... !

Leçons tirées de l’intérieur des laboratoires d’IA chinois

La manière de penser des chercheurs chinois

Les caractéristiques des chercheurs étudiants

L’ambiance sur le terrain à Pékin et dans l’écosystème IA chinois

Différences et similitudes de l’industrie chinoise de l’IA

1. Premiers signes de demande domestique en IA

2. La plupart des développeurs utilisent Claude

3. Le réflexe de propriété technologique

4. Le soutien public existe, mais son ampleur reste floue

5. Une industrie de la donnée bien moins développée

6. Une demande urgente pour les puces Nvidia

Équilibre mondial

À lire aussi

2 commentaires