π0 de Physical Intelligence, première IA de politique générale, rend possible le pliage du linge
(physicalintelligence.company)-
Intelligence physique (π)π0 : notre première politique générale
-
Nous vivons à l’ère de la révolution de l’IA. Si l’IA peut résoudre des problèmes « faciles » comme gagner aux échecs ou découvrir de nouveaux médicaments, les problèmes du monde physique, comme plier une chemise ou ranger une table, restent difficiles. Pour y remédier, il faut doter les systèmes d’IA d’une intelligence physique.
-
Au cours des huit derniers mois, nous avons développé π0, un modèle de base robotique généraliste, première étape vers la création d’une IA permettant aux utilisateurs de demander à un robot d’exécuter les tâches souhaitées. π0 couvre les images, le texte et les actions, et acquiert une intelligence physique à travers l’expérience du robot.
-
La promesse d’une politique robotique générale
-
Aujourd’hui, les robots n’ont qu’une expertise étroite, et ils ne peuvent pas agir dans des environnements complexes. L’IA peut simplifier la programmation de nouveaux comportements en permettant aux robots d’apprendre et de suivre les consignes des utilisateurs. Cela nécessite beaucoup de données.
-
Si l’on parvient à entraîner une politique robotique générale, on peut créer un modèle capable d’exécuter diverses compétences et de contrôler différents robots. Il peut ensuite être spécialisé sur de nouvelles tâches avec peu de données.
-
Un mélange d’entraînement inter-implémentations
-
π0 a été entraîné à l’aide d’un préentraînement vision-langage à l’échelle d’Internet, de jeux de données open source de manipulation robotique, et de jeux de données de tâches sophistiquées provenant de huit robots différents. Il peut accomplir diverses tâches, soit en zero-shot via des prompts, soit grâce au fine-tuning.
-
Hériter d’une compréhension sémantique à l’échelle d’Internet
-
π0 hérite des connaissances sémantiques et de la compréhension visuelle d’un modèle vision-langage (VLM) préentraîné à l’échelle d’Internet. Les VLM sont entraînés pour modéliser les textes et les images du Web.
-
Post-entraînement pour une manipulation fine
-
Les tâches complexes et délicates peuvent être spécialisées en affinant le modèle. Par exemple, plier du linge est une tâche extrêmement difficile.
-
Évaluation et comparaison de π0
-
π0 affiche de meilleures performances sur l’ensemble des tâches par rapport aux autres modèles de base robotiques. Il surpasse également π0-small.
-
La suite
-
L’objectif de Physical Intelligence est de développer un modèle de base capable de contrôler tous les robots. Les expériences menées jusqu’à présent montrent qu’il peut piloter divers robots et réaliser des tâches qui n’avaient auparavant jamais été accomplies avec succès. Cependant, la politique robotique générale n’en est encore qu’à ses débuts et nécessitera encore de nombreuses avancées.
1 commentaires
Avis sur Hacker News
Mention de la nécessité de robots domestiques pour la satisfaction humaine
Scepticisme quant à l’utilité pratique des robots
Le problème des contraintes d’espace dans les villes européennes
Le potentiel des robots comme outils d’automatisation de laboratoire
Le potentiel des robots cuisiniers
La simplicité des robots et la question du coût
L’évolution de la lessive
La question de la vitesse des robots