9 points par GN⁺ 2024-04-05 | 3 commentaires | Partager sur WhatsApp

3 commentaires

 
kyunghoon 2024-04-06

Les chansons en coréen chantées par l’IA ne me paraissent plus du tout étranges maintenant.
https://www.youtube.com/watch?v=P5g5XGmhxOo

 
xguru 2024-04-05

J’ai récemment écouté quelques chansons créées avec Suno, et même avec des paroles en coréen, il les réussit parfaitement.

 
GN⁺ 2024-04-05
Avis Hacker News
  • L’intérêt croissant pour les synthétiseurs vocaux, les systèmes de TTS et le NLP en général a été l’une des principales raisons pour lesquelles j’ai étudié l’informatique et la linguistique computationnelle. Ces technologies relevaient de la science-fiction qui paraissait impossible quand j’étais à l’université, et je n’en reviens toujours pas de la vitesse des progrès actuels dans ce domaine. suno.ai peut même imiter une voix hachée et robotique.
  • J’ai remarqué que suno.ai déforme de façon amusante la prononciation de certains mots. Par exemple, "sublicence" devient "sublissence", "fitness" devient "fisted", "infringement" devient "infring-ment" et "liable" devient "liar-ful". De plus, les changements de hauteur de la voix donnent l’impression d’être auto-tunés ou électronisés. Je m’attends à voir émerger des spécialistes capables de détecter les voix générées par l’IA.
  • La prononciation du mot "software" était amusante.
  • Je n’avais pas été aussi impressionné par l’IA depuis GPT4. En tant que musicien amateur, je recommande d’essayer Suno.ai. Cette technologie pourrait devenir un substitut aux services d’abonnement musical, et elle pourrait être un choc pour les professionnels.
  • Dans cette discussion, l’accent est mis sur la synthèse vocale. D’autres commentateurs ont déjà évoqué les points importants, donc je n’en rajoute pas. Musicalement, on est encore loin de générer quelque chose de vraiment intéressant. L’harmonie, le tempo, la structure, la dynamique, tout est confus et sans structure. Il semble difficile d’atteindre un niveau supérieur avec un modèle purement génératif. Une approche hybride, mêlant règles et génération, pourrait être nécessaire.
  • J’ai fait composer un morceau par Claude Sonnet puis je l’ai édité dans Suno ; le style ne collait pas, mais le résultat était plutôt bon.
  • J’ai réécrit la chanson de peur de Dune avec Bing Chat pour parler de la lutte contre la complexité du code, puis j’en ai fait via suno.ai une chanson de deux minutes exprimant ce que l’on ressent face à du code qui a besoin d’être simplifié.
  • J’ai l’habitude de murmurer intérieurement quand je lis, et j’ai ce penchant un peu rare à imaginer que quelqu’un chante les mots que je lis sur la mélodie d’une chanson qui me reste en tête.
  • La fille est triste parce qu’elle ne connaît pas le nom de la personne ou de l’artiste dont la musique et la voix ont été modélisées.
  • Je suis impressionné par le fait qu’ils aient réussi à extraire des rimes à partir d’une licence.