Atteindre un niveau compétitif humain au tennis de table robotisé

L’équipe de DeepMind a annoncé qu’en s’appuyant sur une architecture de politique hiérarchique et des techniques d’adaptation en temps réel, un agent robotique de tennis de table a atteint un niveau de jeu comparable à celui d’humains amateurs.
Ce robot a été validé via le transfert simulation-réalité en zéro-shot (sim-to-real), l’adaptation en conditions réelles et des tests de match contre de véritables adversaires humains.
Résultat : il a affiché un taux de victoire de 100 % contre les débutants et de 55 % contre les joueurs intermédiaires, démontrant un niveau de jeu clairement équivalent à celui d’un humain intermédiaire.

Le tennis de table est un sport complexe qui exige à la fois de la stratégie et un contrôle moteur à grande vitesse, ce qui en fait un défi de niveau humain pour les robots.
Les travaux précédents se limitaient à de simples échanges, et cette étude est la première à mettre en scène un véritable jeu compétitif contre des humains réels.
Les contributions de cette recherche sont les suivantes :
- Architecture de politique hiérarchique (HLC + LLC)
- Méthode de transfert sim-to-real en zéro-shot
- Système d’adaptation de l’adversaire en temps réel
- Expérience d’évaluation utilisateur menée avec 29 joueurs humains réels

Le contrôleur de bas niveau (LLC) dispose de politiques spécialisées pour certaines techniques (coup droit, revers, service, etc.) ainsi que de descripteurs de compétences (skill descriptor).
Le contrôleur de haut niveau (HLC) sélectionne la technique appropriée en tenant compte de la situation de jeu, des statistiques de l’adversaire et des caractéristiques de chaque LLC.
Le processus d’entraînement suit la séquence données humaines initiales → simulation → application en conditions réelles → apprentissage itératif, ce qui crée une structure d’apprentissage par curriculum automatique.

Matchs disputés contre 29 joueurs humains de niveaux variés :
- Débutants : 100 % de victoires
- Intermédiaires : 55 % de victoires
- Avancés et au-delà : aucune victoire
  → Taux de victoire global : 45 % (par match), 46 % (par set)
Lors de l’évaluation qualitative, les participants ont jugé l’expérience « amusante et immersive » et ont joué volontairement plus de 4 minutes sur 5 en moyenne.
Points faibles :
- Maîtrise insuffisante des balles à effet coupé
- Difficulté à gérer les balles basses
  → Cela s’explique par la difficulté d’éviter les collisions avec la table et d’estimer les effets, des points à améliorer à l’avenir

À lire aussi