L’industrialisation de l’intelligence robotique incarnée (Embodied)

Des capitaux massifs et des talents de tout premier plan affluent vers la robotique, mais les déploiements réels sur le terrain restent encore très limités en dehors d’environnements restreints comme l’automatisation industrielle
Des transformations structurelles se produisent simultanément, avec la baisse du coût des composants, l’amélioration de l’économie des batteries, les progrès des architectures de modèles et l’amélioration des environnements de simulation
Les données robotiques sont fondamentalement contraintes : face à environ 1 milliard d’heures de vidéos sur Internet, on ne compte qu’environ 300 000 heures de données mondiales de manipulation robotique
Alors que les coûts des actionneurs, des batteries, du compute et des systèmes baissent et que le coût du travail augmente, nous atteignons un point de croisement économique où la valeur marginale de l’automatisation augmente
Trois domaines de goulots d’étranglement seront au cœur de l’accumulation de valeur à venir : l’acquisition de données, les laboratoires d’IA robotique et les fournisseurs de solutions verticales

Situation actuelle : à l’intersection entre hype et transformations structurelles

D’énormes capitaux affluent vers la robotique et les démonstrations impressionnantes se multiplient, mais sur le terrain — dans les entrepôts, fermes, usines, hôpitaux ou chantiers — les déploiements réels restent très éloignés d’un changement de fond du travail traditionnel
La hype est soutenue par des transformations structurelles : baisse du coût des composants, amélioration de l’économie des batteries, architectures de modèles plus puissantes, meilleurs environnements de simulation et d’entraînement, afflux de capitaux et volant d’inertie des talents alimenté par des ambitions adjacentes à l’AGI
La question centrale n’est pas de savoir si la robotique a du potentiel, mais si elle se trouve à un point d’inflexion pour l’adoption commerciale et grand public, et comment valider l’élan actuel

Les quatre ères de l’histoire de la robotique

I. 1950–2000 : entrée dans l’industrie et phase de fondation

Une époque définie par la mécatronique programmable, marquée par l’introduction en 1961 chez General Motors du premier robot industriel, Unimate, destiné à des mouvements mécaniques limités
Le Stanford Arm a étendu les capacités multiaxes et est resté un axe majeur de recherche jusqu’aux années 1990
L’arrivée du PLC de Modicon en 1968 et du microprocesseur Intel 4004 en 1971 a rendu l’intelligence des machines économiquement extensible à l’ensemble de l’automatisation industrielle
Dans les années 1980, l’IBM PC a fait entrer l’informatique dans le courant dominant de l’ingénierie, intégrant les robots comme partie d’un environnement de production numérique plutôt que comme installations mécaniques isolées

II. 2000–2010 : l’ère de l’open robotics et des composants mobiles

En 2007, le premier commit de ROS (Robot Operating System) et la plateforme de recherche PR2 ont fourni pour la première fois à la communauté une couche logicielle partagée et un environnement de développement commun
La même année, le lancement de l’iPhone d’Apple a enclenché une compression durable des coûts à travers toute la chaîne d’approvisionnement en capteurs, batteries, caméras, compute embarqué et électronique basse consommation, dont la robotique a ensuite bénéficié
Universal Robots (fondée en 2005), le Roomba d’iRobot (2002) et Kiva Systems (2003) en ont été des bénéficiaires directs
En 2012, l’acquisition de Kiva par Amazon a constitué le premier signal concret montrant que la robotique pouvait générer une valeur commerciale stratégique au-delà de l’enthousiasme de la recherche

III. 2010–2020 : robots collaboratifs et edge compute

Trois dynamiques convergent : (1) la fiabilité commerciale des robots collaboratifs — le KUKA LBR iiwa devient le premier robot sensible produit en série certifié pour la collaboration homme-robot, tandis qu’Universal Robots continue de pousser l’accessibilité et la facilité de déploiement
(2) Le lancement du Nvidia Jetson en 2014 rend le GPU edge compute pratique, rapprochant l’IA temps réel et la vision par ordinateur de systèmes réellement déployables (CUDA en 2006, puis architectures basées sur les transformers)
(3) Une transformation profonde de la stack IA — des percées comme Trust Region Policy Optimization, Model-Agnostic Meta-Learning et Non-Local Neural Networks commencent à remplacer les pipelines artisanaux par une perception et un contrôle de bout en bout pilotés par les données
Au final, la robotique passe de règles codées en dur dans des environnements structurés à un apprentissage perceptif fondé sur le reinforcement learning, la simulation et l’imitation, avec acquisition de compétences motrices par les données plutôt que par programmation explicite

IV. 2020–aujourd’hui : la Physical AI

L’article de Google sur les transformers en 2017 débouche sur RT-1 (2022), qui reformule le contrôle robotique comme un problème de transformers entraînés sur de vastes jeux de données réels et variés
RT-2 (2023) étend l’approche à un modèle vision-language-action (VLA) entraîné à la fois sur des données web et robotiques
NVIDIA annonce Project GR00T (2024), puis dévoile avec GR00T N1 (2025) un modèle foundation ouvert pour robots humanoïdes
De nouveaux laboratoires de modèles robotiques émergent, comme Physical Intelligence, Skild AI et Field AI
Des connexions sans fil plus rapides via la 5G, une téléopération plus fiable, de meilleures pipelines de données et de meilleures capacités hardware sur site élargissent les opérations à distance, les logiciels de flotte et les boucles de collecte de données

L’évolution des conditions économiques

Baisse du coût des composants et des systèmes

Les principaux composants d’un système robotique sont les actionneurs, capteurs, batteries, semi-conducteurs/chips et structures mécaniques ; l’humanoïde constitue un proxy raisonnable puisqu’il regroupe la plupart d’entre eux
Morgan Stanley a décomposé le BOM de Tesla Optimus par section afin d’illustrer la contribution de chaque composant dans l’ensemble du système

Actionneurs

Ils représentent la plus grande part du coût dans de nombreux systèmes robotiques, et la domination de la Chine sur ce marché ajoute de la complexité selon les cas d’usage et la résilience des chaînes d’approvisionnement
Le prix moyen des actionneurs suit une tendance haussière au-delà de l’inflation, mais une fois normalisé par la densité, les perspectives réelles s’améliorent de manière significative
La précision, le contrôle et le mouvement fin des actionneurs linéaires électriques continuent de progresser — l’erreur de suivi des moteurs linéaires à aimants permanents est passée de moins de 7μm en 2003 à environ 0,5μm RMS dans des recherches ultérieures

Coût des batteries

Il a fortement chuté sous l’effet de l’industrie automobile et du stockage à l’échelle du réseau
Pour le Li-Ion, le coût par kWh a baissé d’environ 87 % depuis 2013, et encore d’environ 36 % depuis 2020, avec une perspective de stabilisation

Coût du compute

Ce n’est pas un poste direct du BOM, mais c’est central pour l’économie de long terme
Pour que les robots dépassent le travail humain, il faut une baisse continue du coût du edge compute ainsi qu’une amélioration des performances des modèles paramétrés
Sur la base de la série de puces Nvidia Jetson, les performances par dollar se sont améliorées d’un ordre de grandeur depuis 2014

Coût système

En prenant les robots industriels comme exemple, il a fortement baissé au cours des 30 dernières années et devrait continuer à diminuer

Coût du travail aux États-Unis

Le salaire horaire moyen continue d’augmenter dans l’entreposage et la logistique, un cas d’usage emblématique
La croissance des salaires dans le transport et l’entreposage dépasse l’inflation sur un indice base 2003, ce qui souligne l’importance de la demande de travail dans ce secteur

Hausse de la valeur économique de l’automatisation

Si l’on agrège ces courbes de coûts, la valeur marginale de l’automatisation/robotique augmente
Cela apparaît clairement lorsqu’on le schématise en NPV, même si la « frontière efficiente » varie selon les modèles
- Hypothèses : salaire d’entrée en entrepôt et avantages sociaux selon Indeed, durée de vie utile de 8 ans, coût de maintenance de 20 % dans un modèle prépayé, taux d’actualisation de 10 %

Les grands arbitrages au point d’inflexion de l’adoption

Hardware vs intelligence — une opposition qui reflète la différence d’approche entre la Chine et les États-Unis. La Chine est avantagée pour le développement hardware grâce à son infrastructure manufacturière et à ses chaînes d’approvisionnement existantes ; les États-Unis ont une avance en IA/ML et dans les premiers laboratoires de modèles foundation LLM. Avec le temps, les zones de recouvrement devraient s’élargir
Industriel vs grand public — saisir une palette et ramasser une assiette peuvent sembler similaires en surface, mais la dynamique du mouvement, de la préhension et les tolérances de pression diffèrent. Avec une présence robotique déjà installée dans l’industrie et un ROI clair, l’industriel s’étendra d’abord, avant une adoption de masse des humanoïdes domestiques
Open source (Android) vs fermé (iOS) — à l’image de la séparation Android/iOS dans le smartphone, la robotique commence aussi à se scinder entre des plateformes ouvertes orientées développeurs (équivalent de ROS, écosystèmes hardware ouverts) et des systèmes fermés verticalement intégrés où hardware, software et modèles sont étroitement unifiés

La stack d’intelligence : au-delà de l’économie

La baisse du coût des composants améliore la finançabilité des robots, mais n’explique pas pourquoi le récit du marché est passé d’une automatisation étroite à des robots plus généralistes — cette transition concerne la couche d’intelligence
Les robots passent d’une perception, planification et représentation du monde fondées sur une ingénierie plus simple à des représentations apprises entraînées sur de grands volumes de vidéo, des démonstrations robotiques, des prédictions synthétiques et des entrées multimodales

1. Le problème des données

La robotique ne dispose pas encore de l’équivalent de l’Internet en données pour le monde physique
Les LLM ont pu moissonner du texte et des médias numérisés, mais l’apprentissage robotique dépend encore de la téléopération, d’opérateurs humains, de hardware physique et d’environnements réels
Écart de données : environ 1 milliard d’heures de vidéos Internet → environ 350 millions d’heures de données de conduite autonome → environ 20 millions d’heures de proxy d’entraînement de world models (Cosmos, etc.) → environ 300 000 heures de données mondiales de manipulation robotique (selon le rapport de Bessemer)
Toutes les données ne sont pas créées ni exploitables de la même façon, et en général la valeur des données et leur scalabilité sont inversement corrélées

2. L’amélioration des performances de la couche d’intelligence

Le savoir sur le monde (world models) comme le savoir d’action (modèles VLM/VLA, modèles foundation robotiques multimodaux) progressent rapidement
Le savoir sur le monde — comportement des objets, flux des liquides, drapé des tissus, etc. — devient de plus en plus apprenable à partir de vidéos riches et de modélisation
Le savoir d’action — la manière dont un bras, une main ou un humanoïde précis convertit une instruction en mouvement — reste spécifique à l’incarnation, mais pourrait nécessiter bien moins de données spécifiquement robotiques que ce que les générations précédentes supposaient
V-JEPA 2 de Meta est préentraîné sur plus d’un million d’heures de vidéo, puis conditionné au comportement avec moins de 62 heures de vidéo robotique
RT-2 de Google étend un apprentissage vision-langage à l’échelle du web au contrôle de robots réels
Les simulateurs restent pertinents, et la locomotion se mappe bien aux moteurs physiques, mais leur rôle tend à se resserrer. Dans la manipulation riche en contacts, les world models appris deviennent plus importants

3. Le passage de la théorie à la solution

De meilleurs modèles se traduisent d’abord par des gains pratiques : meilleure préhension, moins d’interventions en téléopération, adaptation plus rapide à de nouveaux SKU, manipulation plus robuste et temps d’autonomie plus longs dans des workflows limités
Le débat se poursuit sur le « moment ChatGPT » de la robotique, mais la question la plus pertinente est plutôt de savoir si la nouvelle couche d’intelligence est suffisamment bonne pour franchir le seuil de passage du pilote à la production
Ordre de résolution de la stack : acquisition des données → laboratoires néo de robotique transformant cela en intelligence réutilisable → fournisseurs de solutions verticales convertissant le tout en économie du travail mesurable

Domaines d’intérêt pour l’investissement : trois goulots d’étranglement clés

1. Manque de disponibilité des données → Data Enablement

Si la robotique est fondamentalement contrainte par les données, alors leur acquisition est l’une des catégories les plus importantes à court terme dans la stack
Cela inclut la capture de données egocentric et de téléopération, la génération d’environnements synthétiques, l’évaluation des edge cases, l’affinage du signal et la création de boucles de feedback pour améliorer les systèmes
Références utiles : Scale AI (labelling et annotation de données), Mercor / Mirco1 (données humaines)
Comme lors de la première vague de data labelling pour l’IA, les entreprises les plus fortes pourraient partir d’un wedge initial en services/outils pour évoluer vers des logiciels de workflow à forte valeur, des outils adjacents aux modèles et des boucles de données propriétaires difficiles à remplacer
Cette fois, cela pourrait aussi inclure du hardware

2. Une couche d’intelligence encore précoce → laboratoires néo de robotique (Robotic Neo Labs)

Alors que la couche d’intelligence devient plus utile tout en restant encore précoce, les laboratoires néo de robotique constituent la prochaine zone logique
Il s’agit d’entreprises qui cherchent à transformer des modèles du monde physique autrefois fragmentés en intelligence réutilisable
La valeur se concentre chez les équipes qui construisent autour des world models, des modèles d’action, des modèles foundation robotiques multimodaux, ainsi que des outils d’entraînement, d’évaluation et de déploiement
Skild, Physical Intelligence et Field AI ont déjà atteint des valorisations de plusieurs milliards de dollars, lançant un cycle de kingmakers autour des laboratoires robotiques
L’intérêt porte davantage sur ce qui se construit autour et sous les laboratoires que sur les laboratoires eux-mêmes — les équipes capables de créer des effets composés sur les données, l’incarnation, l’évaluation et l’efficacité de l’inférence seront les véritables gagnantes
Les trajectoires d’exit devraient aussi différer des cycles robotiques précédents — la vitesse, la densité de talents, les données propriétaires et le positionnement technique pourraient compter davantage que les jalons traditionnels
On peut s’attendre à davantage d’acquihires, de résultats fondés sur l’IP et de partenariats stratégiques
L’intérêt pour l’inférence en edge et le compute spécialisé on-device pourrait revenir au premier plan, à mesure que les laboratoires et leurs partenaires cherchent à réduire leur dépendance à un compute centralisé coûteux

3. Transformer les progrès techniques en résultats concrets dans les workflows → fournisseurs de solutions verticales (VSP)

Si une meilleure intelligence rend les robots plus compétents dans des environnements limités, les bénéficiaires commerciaux les plus immédiats seront les entreprises capables de les déployer dans de vrais workflows clients
De nombreux workflows physiques sont assez contraints pour être apprenables, assez précieux pour justifier un déploiement, et assez complexes pour qu’une meilleure intelligence ait été la pièce manquante
Les cas d’usage industriels et commerciaux semblent plus prometteurs à court terme que les usages grand public — le ROI est plus clair, les problèmes de main-d’œuvre plus immédiats et la trajectoire du pilote à la production plus facile à faire adopter
L’absence de standard universel d’adoption reste un défi — les clients évaluent sur une échelle glissante entre vitesse (articles emballés par heure), précision (part des articles correctement prélevés), et coût (coût horaire nivelé), avec l’efficacité du travail comme métrique ultime
L’expansion commencera probablement par l’augmentation de la main-d’œuvre — le ROI sera trouvé surtout dans les segments en pénurie de personnel et sur les créneaux à faible disponibilité de main-d’œuvre comme la nuit et le week-end, où des seuils plus faibles de vitesse et de précision justifient des coûts initiaux élevés tout en permettant d’atteindre une échelle domestique
La couche suivante de capture de valeur est déjà visible : intégration, servicing, gestion du temps de disponibilité, maintenance et financement
- Formic a signalé très tôt cette réalité : à mesure que les robots passent du pilote à la flotte, l’écosystème périphérique devient lui aussi investissable
- C’est souvent là que se construisent les entreprises durablement viables sur de nombreux marchés

L’industrialisation de l’intelligence robotique incarnée (Embodied)

Situation actuelle : à l’intersection entre hype et transformations structurelles

Les quatre ères de l’histoire de la robotique

I. 1950–2000 : entrée dans l’industrie et phase de fondation

II. 2000–2010 : l’ère de l’open robotics et des composants mobiles

III. 2010–2020 : robots collaboratifs et edge compute

IV. 2020–aujourd’hui : la Physical AI

L’évolution des conditions économiques

Baisse du coût des composants et des systèmes

Actionneurs

Coût des batteries

Coût du compute

Coût système

Coût du travail aux États-Unis

Hausse de la valeur économique de l’automatisation

Les grands arbitrages au point d’inflexion de l’adoption

La stack d’intelligence : au-delà de l’économie

1. Le problème des données

2. L’amélioration des performances de la couche d’intelligence

3. Le passage de la théorie à la solution

Domaines d’intérêt pour l’investissement : trois goulots d’étranglement clés

1. Manque de disponibilité des données → Data Enablement

2. Une couche d’intelligence encore précoce → laboratoires néo de robotique (Robotic Neo Labs)

3. Transformer les progrès techniques en résultats concrets dans les workflows → fournisseurs de solutions verticales (VSP)

À lire aussi

Aucun commentaire pour le moment.