- Application open source qui transforme des fichiers musicaux personnels en karaoké, avec séparation vocale, synchronisation des paroles et score en temps réel
- Utilise le modèle UVR Karaoke ou Demucs pour séparer les voix et l’accompagnement, puis WhisperX pour transcrire automatiquement les paroles mot par mot
- Mesure les performances vocales comme dans un jeu grâce à un score de justesse basé sur l’entrée micro, ainsi qu’à un système d’étoiles et un historique par morceau
- Prend en charge diverses interactions, notamment plusieurs profils utilisateur, la lecture de fichiers vidéo en arrière-plan, des arrière-plans dynamiques basés sur des shaders GPU et le contrôle à la manette
- Fonctionne sur Linux, macOS et Windows et repose sur une architecture autonome avec exécutable unique, sans installation
Fonctionnalités principales
- La séparation vocale (Stem separation) utilise le modèle UVR Karaoke ou Demucs pour séparer la voix et l’accompagnement
- Le volume de la voix guide peut être ajusté
- Les paroles mot par mot (Word-level lyrics) utilisent WhisperX pour aligner chaque mot sur l’audio
- Si des paroles existantes sont disponibles sur LRCLIB, elles sont utilisées en priorité
- Le score de justesse (Pitch scoring) calcule le score en temps réel quand on chante dans le micro
- La progression est suivie via un système d’étoiles et un tableau des scores par morceau
Utilisateurs et interface
- Les profils de joueur (Player profiles) permettent à plusieurs utilisateurs de conserver leurs propres historiques de score
- Aucun risque de perte de données lors du changement de chanteur
- La prise en charge des fichiers vidéo (Video file support) permet de charger des fichiers
.mp4 ou .mkv et de lire la vidéo d’origine en arrière-plan
- Les voix sont automatiquement séparées à partir de l’audio
- Les arrière-plans dynamiques (Dynamic backgrounds) peuvent utiliser des effets de shader GPU (plasma, aurore, nébuleuse, etc.), des boucles vidéo Pixabay ou la vidéo d’origine comme fond
- La prise en charge des manettes (Gamepad) permet de naviguer dans les menus, sélectionner les morceaux et contrôler la lecture avec une manette
Fonctionnement
- À l’étape Separate, UVR Karaoke ou Demucs sépare la piste en voix et accompagnement
- L’audio est automatiquement extrait des fichiers vidéo
- À l’étape Transcribe, l’application cherche des paroles synchronisées sur LRCLIB et, si elle n’en trouve pas, effectue une transcription mot par mot avec WhisperX
- À l’étape Play, l’accompagnement est lu avec affichage simultané des paroles surlignées, du score de justesse, des arrière-plans dynamiques et des entrées manette
Plateformes et distribution
- Compatible avec Linux(x86_64, aarch64), macOS(ARM, Intel) et Windows(x86_64)
- Prend en charge l’accélération GPU via CUDA ou Metal, et fonctionne sur CPU si elle n’est pas disponible
- ffmpeg, Python, PyTorch et les modèles de ML sont automatiquement initialisés au premier lancement, ce qui permet une architecture en binaire unique sans procédure d’installation séparée
Notifications de mise à jour
- Il est possible de recevoir par e-mail les nouvelles versions et les annonces de mise à jour, avec désabonnement possible à tout moment
Aucun commentaire pour le moment.