- Meta AI a annoncé CoTracker, un nouveau modèle conçu pour suivre les points (pixels) dans une vidéo
- CoTracker vise à suivre plusieurs points sur l’ensemble de la vidéo en tenant compte des corrélations entre les points
- L’architecture s’appuie sur des idées issues de la littérature sur le flux optique et le tracking, et utilise un réseau de transformeurs avec des couches d’attention spécialisées
- Il peut être appliqué à de longues vidéos grâce à une approche par fenêtre glissante, et s’est montré plus efficace et plus précis que d’autres méthodes de suivi de points
- Le modèle produit des trajectoires plus propres et plus linéaires, en particulier lorsqu’il y a des occultations
- En matière de précision, CoTracker affiche de meilleures performances que d’autres travaux comme TAPIR et Multi-Flow Tracking
- Il représente une avancée importante pour les ingénieurs logiciels en leur offrant un nouvel outil puissant pour suivre des points dans des vidéos, avec de meilleures performances et une plus grande précision
3 commentaires
La démo est plutôt jolie. En pensant à ce qu’il faut pour la VR, on a aussi l’impression qu’il y a un certain alignement avec le business...
Commentaire Hacker News
L’angle business de la branche recherche de Meta n’est pas clair, et sa relation avec le cœur de métier n’est pas facile à comprendre.
C’est vraiment le commentaire clé ici. La recherche, c’est bien, mais il y a aussi beaucoup d’aspects où l’alignement avec le business n’est pas très clair.
Ça donne presque l’impression de revoir le Google d’autrefois...