- Le fonctionnalité AI DJ de Spotify met en évidence les limites de l’IA et les problèmes des métadonnées musicales à travers son incapacité à reconnaître correctement la musique classique
- Lorsqu’un utilisateur demande la « 7e Symphonie de Beethoven », l’IA ne comprend ni la structure de l’œuvre ni l’ordre des mouvements et lance un mouvement sans rapport ou une pièce d’un autre compositeur
- Malgré des consignes précises comme « jouer tous les mouvements dans l’ordre », l’IA sélectionne une mauvaise symphonie ou des enregistrements mélangés dans le désordre, produisant des résultats incohérents
- La cause profonde de ces erreurs est que les métadonnées de la musique numérique ont été conçues autour de la pop, sans refléter les notions de compositeur, d’œuvre et de mouvement
- Le texte souligne l’écart entre les attentes placées dans « l’intelligence » de l’IA et la réalité, et se conclut sur une remarque cynique selon laquelle la préservation de la tradition musicale occidentale n’a aucun lien avec l’intérêt des entreprises
Expérience d’utilisation de l’AI DJ et prise de conscience du problème
- Le texte s’ouvre sur la question « l’IA est-elle vraiment intelligente ? » et pose le problème de savoir si la responsabilité des erreurs de l’IA incombe aux programmeurs
- En essayant de rechercher de la musique classique via la fonction AI DJ de l’application Spotify, l’auteur constate à nouveau les limites de la structure de recherche existante de Spotify
- L’auteur, qui écoute volontiers non pas de la pop mais 500 ans de tradition musicale occidentale, cite comme exemples des compositeurs allant de Tallis à Shaw
Limites structurelles des métadonnées musicales numériques
- Les métadonnées des fichiers musicaux numériques se composent de trois tags, Artist, Album, Song, une structure conçue autour de la pop
- L’auteur souligne que le terme « Song » est une désignation impropre lorsqu’il s’applique aussi à la musique instrumentale, et explique qu’en musique classique, « composition » ou « work » seraient plus appropriés
- Comme la notion de « mouvement », centrale dans la structure de la musique classique, n’est pas reflétée dans les métadonnées, Spotify ne parvient pas à reconnaître l’organisation complète d’une œuvre
Test de lecture de la 7e Symphonie de Beethoven
- À la commande « Play Beethoven’s 7th Symphony », l’IA ne lance que le 2e mouvement Allegretto, puis enchaîne avec des morceaux sans aucun rapport
- Même à la demande « Play Beethoven’s 7th Symphony in its entirety », l’IA comprend à tort qu’il s’agit d’une œuvre complète de 9 minutes et ne joue encore que le 2e mouvement
- Avec « Play Beethoven’s 7th Symphony from beginning to end », elle reproduit le même comportement, le 2e mouvement uniquement, avant de passer à une pièce de John Field
- Quand on lui demande « Play all four movements », elle commence bien par le 1er mouvement, mais mélange des enregistrements de différents orchestres et inverse l’ordre
- Avec « Play all four movements in numerical order », elle produit un résultat totalement erroné, en commençant par exemple par le 1er mouvement de la 3e Symphonie
Manque de compréhension musicale de l’IA
- Le texte souligne que l’IA ne comprend absolument pas la structure en mouvements d’une œuvre ni la notion d’ordre
- Alors qu’il suffit de lire la première phrase de Wikipedia pour savoir qu’une symphonie de Beethoven se compose de 4 mouvements, l’IA n’en tient pas compte
- L’auteur tourne cette ignorance en dérision en la comparant au fait de lire d’abord le dernier chapitre d’un livre audio
Conclusion : rupture entre l’IA et la tradition musicale
- Le texte adopte une position sceptique face à l’idée selon laquelle l’IA pourrait « composer » de la musique, et critique une IA incapable de maîtriser les concepts de base tout en prétendant à la création
- Tout en reconnaissant que Spotify DJ est encore en phase bêta, l’auteur conclut sur un pessimisme réaliste : les entreprises n’ont aucune motivation à préserver la tradition musicale occidentale
- Dans l’ensemble, le problème est présenté comme la combinaison des limites de la technologie IA, du biais dans la conception des métadonnées et d’un désintérêt culturel
1 commentaires
Commentaires sur Hacker News
Ce n’est pas un problème d’IA mais de conception produit. Spotify DJ n’est en pratique guère plus qu’un « shuffle + commentaires vocaux », et il est tout à fait possible qu’il existe du code empêchant délibérément la lecture d’un album complet
Généraliser l’IA comme un concept unique est une mauvaise approche. Le raisonnement du type « si cette fonctionnalité ne marche pas, alors l’IA ne sert à rien » relève d’une erreur de catégorie (category error)
L’ensemble du texte mélange plusieurs idées de façon confuse, et la moitié se résume à une liste de titres de musique classique. Je suis d’accord pour dire que Spotify DJ n’est pas terrible, mais ce n’est pas une manière convaincante d’en faire la critique
rdans un motOn n’y voit aucune tentative d’explorer les forces et les limites de la technologie, seulement le schéma classique consistant à rabaisser toute l’IA à partir d’un cas très étroit. L’IA n’est pas humaine, il est donc normal qu’elle ait des limites
J’ai observé quelque chose de similaire avec les assistants de code IA. Certains les rejettent en bloc pour des raisons de sécurité, tout en ignorant la possibilité de « créer une app Mac native en une seule phrase »
Ce qui fait le charme des mixes DJ sur YouTube, comme Hör Berlin, c’est le choix et l’interprétation du DJ, ainsi que son contexte culturel. Quand l’IA extrait une liste optimisée, elle perd cette essence
Spotify combine des licences de type radio et des licences interactives pour réduire ses coûts. Une playlist générée par l’IA n’étant pas un choix direct de l’utilisateur, il est probable qu’elle soit traitée sous le régime radio
J’écoute souvent des radios comme dublab, NTS1 ou NTS2, où l’on tombe sur de la musique inattendue
Même avec des centaines de millions de dollars investis, on n’a jamais réussi à rendre la recommandation parfaite, ni à remplacer la preuve sociale (social proof) que représente un DJ humain
Il est aussi regrettable de voir une vision de la musique qui semble réduire celle-ci à la pop et au classique occidental
Pour moi, c’est un échec de conception du prompt. Si l’on teste la même demande avec cet exemple ChatGPT, l’IA réagit correctement
Autrement dit, soit le modèle de Spotify est faible, soit son prompt interne l’oriente dans la mauvaise direction
La thèse selon laquelle « l’IA ne peut pas composer de musique » est aussi une mauvaise comparaison. L’IA a déjà montré qu’elle pouvait comprendre la théorie musicale et une certaine capacité de composition. Au final, c’est surtout une question de qualité et de goût
Chaque fois que les gens appellent les LLM de « l’IA », cela déforme leur perception.
C’est à la fois la plus grande réussite du marketing et l’un des plus grands torts infligés au monde