11 points par GN⁺ 2026-03-19 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Application open source qui transforme des fichiers musicaux personnels en karaoké, avec séparation vocale, synchronisation des paroles et score en temps réel
  • Utilise le modèle UVR Karaoke ou Demucs pour séparer les voix et l’accompagnement, puis WhisperX pour transcrire automatiquement les paroles mot par mot
  • Mesure les performances vocales comme dans un jeu grâce à un score de justesse basé sur l’entrée micro, ainsi qu’à un système d’étoiles et un historique par morceau
  • Prend en charge diverses interactions, notamment plusieurs profils utilisateur, la lecture de fichiers vidéo en arrière-plan, des arrière-plans dynamiques basés sur des shaders GPU et le contrôle à la manette
  • Fonctionne sur Linux, macOS et Windows et repose sur une architecture autonome avec exécutable unique, sans installation

Fonctionnalités principales

  • La séparation vocale (Stem separation) utilise le modèle UVR Karaoke ou Demucs pour séparer la voix et l’accompagnement
    • Le volume de la voix guide peut être ajusté
  • Les paroles mot par mot (Word-level lyrics) utilisent WhisperX pour aligner chaque mot sur l’audio
    • Si des paroles existantes sont disponibles sur LRCLIB, elles sont utilisées en priorité
  • Le score de justesse (Pitch scoring) calcule le score en temps réel quand on chante dans le micro
    • La progression est suivie via un système d’étoiles et un tableau des scores par morceau

Utilisateurs et interface

  • Les profils de joueur (Player profiles) permettent à plusieurs utilisateurs de conserver leurs propres historiques de score
    • Aucun risque de perte de données lors du changement de chanteur
  • La prise en charge des fichiers vidéo (Video file support) permet de charger des fichiers .mp4 ou .mkv et de lire la vidéo d’origine en arrière-plan
    • Les voix sont automatiquement séparées à partir de l’audio
  • Les arrière-plans dynamiques (Dynamic backgrounds) peuvent utiliser des effets de shader GPU (plasma, aurore, nébuleuse, etc.), des boucles vidéo Pixabay ou la vidéo d’origine comme fond
  • La prise en charge des manettes (Gamepad) permet de naviguer dans les menus, sélectionner les morceaux et contrôler la lecture avec une manette

Fonctionnement

  • À l’étape Separate, UVR Karaoke ou Demucs sépare la piste en voix et accompagnement
    • L’audio est automatiquement extrait des fichiers vidéo
  • À l’étape Transcribe, l’application cherche des paroles synchronisées sur LRCLIB et, si elle n’en trouve pas, effectue une transcription mot par mot avec WhisperX
  • À l’étape Play, l’accompagnement est lu avec affichage simultané des paroles surlignées, du score de justesse, des arrière-plans dynamiques et des entrées manette

Plateformes et distribution

  • Compatible avec Linux(x86_64, aarch64), macOS(ARM, Intel) et Windows(x86_64)
  • Prend en charge l’accélération GPU via CUDA ou Metal, et fonctionne sur CPU si elle n’est pas disponible
  • ffmpeg, Python, PyTorch et les modèles de ML sont automatiquement initialisés au premier lancement, ce qui permet une architecture en binaire unique sans procédure d’installation séparée

Notifications de mise à jour

  • Il est possible de recevoir par e-mail les nouvelles versions et les annonces de mise à jour, avec désabonnement possible à tout moment

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.