- Eureka utilise un LLM (GPT-4) pour générer automatiquement des algorithmes de récompense (code logiciel) afin d’entraîner les robots à effectuer des tâches complexes
- Entraîne une main robotique à réaliser une figure de « rotation de stylo » semblable à celle d’un humain
- Eureka apprend aussi aux robots à ouvrir des tiroirs et des placards, à lancer et attraper une balle, et à manipuler des ciseaux
- Ne nécessite ni prompts spécifiques à chaque tâche ni modèles de récompense prédéfinis, et intègre facilement le feedback humain
Aucun commentaire pour le moment.