- Google DeepMind a présenté RoboCat, qui apprend par lui-même en effectuant diverses tâches avec un bras robotique.
- Il s’appuie sur Gato (qui signifie « chat » en espagnol), un modèle multimodal capable de fonctionner à la fois dans des environnements réels et simulés.
- Pour s’auto-améliorer, il commence par collecter des données réelles sur une nouvelle tâche.
- À partir de ces données réelles, il affine le modèle de base pour créer un agent dérivé.
- Le nouvel agent s’entraîne environ 10000 fois pour constituer un jeu de données d’entraînement.
- Les données réelles et les données auto-générées sont intégrées au jeu de données d’entraînement de RoboCat.
- Entraînement de la nouvelle version de RoboCat.
- Cela lui permet de s’adapter en quelques heures à de nouveaux bras robotiques ayant davantage d’articulations ou plus de pinces.
- Cela crée aussi un cercle vertueux d’apprentissage : le modèle initial, qui affichait un taux de réussite de 36 % sur certaines tâches, a plus que doublé pour atteindre 74 %.
3 commentaires
Enfin, l’IA rencontre le monde réel et ouvre la voie à l’expérimentation concrète.
Les commentaires du fil HN sont vraiment très drôles.
J’ai eu exactement la même pensée :
Suis-je le seul à avoir espéré un chat robot ? C’est un peu décevant...J’aimerais bien qu’ils mettent au moins un autocollant de chat sur le bras robotique.
En résumant l’article, on obtient ceci.
RoboCat est un agent auto-amélioré pour la manipulation robotique. Il est entraîné sur un jeu de données vaste et diversifié de tâches robotiques, à partir de multiples simulations et de bras robotiques réels.
Les principaux objectifs de RoboCat sont les suivants.
Les principaux résultats sont les suivants.
En résumé, RoboCat, un agent auto-amélioré pour la manipulation robotique entraîné sur un jeu de données vaste et diversifié, montre qu’il peut généraliser à de nouvelles tâches et à de nouveaux robots avec un minimum de données grâce au fine-tuning et à l’auto-amélioration. Sa capacité à exploiter à grande échelle des expériences robotiques hétérogènes pourrait transformer l’apprentissage robotique.