- Un système de recherche musicale se compose de deux étapes : l’enregistrement et la recherche
- Enregistrement : convertir les sources audio existantes en empreintes audio (Audio Fingerprint) et les stocker dans une base de données
- Recherche : convertir l’audio d’entrée en empreinte audio, puis le comparer à la base de données pour retrouver des sources audio similaires
- Connaissances de base
- Fichier WAV : format PCM non compressé, qui conserve l’original sans altération des données
- Échantillonnage (Sampling) : conversion d’un signal analogique en numérique ; plus la fréquence d’échantillonnage est élevée, plus la précision augmente
- Spectrogramme (Spectrogram) : graphique visualisant les variations de fréquence et d’amplitude
- Transformée de Fourier : conversion d’un signal dans le domaine fréquentiel pour analyser le son
- Pic (Peak) : donnée représentant les principales composantes fréquentielles, permettant de supprimer le bruit et de compresser les données
- Empreinte audio (Audio Fingerprint) : générée en hachant les données de pics, utilisée pour le stockage en base de données et la recherche
- Processus d’implémentation
- Lire le fichier WAV et générer les données d’échantillonnage
- Appliquer une transformée de Fourier aux données d’échantillonnage pour générer un spectrogramme
- Extraire les pics du spectrogramme
- Hacher les données de pics pour générer une empreinte audio
- Stocker l’empreinte audio dans une base de données ou l’utiliser pour la recherche afin d’identifier des sources audio similaires
1 commentaires
Umi