Google dévoile SoundStream, un codec audio neuronal de bout en bout
(ai.googleblog.com)- Premier codec à réseau neuronal applicable à la fois à la voix et à la musique
→ exécutable en temps réel sur le CPU d’un smartphone
→ encode divers types de sons, dont l’audio haute qualité et la voix claire, la voix avec beaucoup de bruit et de réverbération, la musique et les sons ambiants
- Entraîné à l’aide de réseaux neuronaux aux deux extrémités, il assure simultanément la compression et l’amélioration de la qualité sonore pour fournir un audio de haute qualité
→ SoundStream surpasse Opus à 12 kpbs dès 3kbps et offre une qualité comparable à EVS 9.6bps
→ comme il utilise 3,2x à 4x moins de bits, il permet de réduire fortement le volume de transmission
→ excellent niveau de suppression du bruit possible
- Intégration prévue à Lyra, le codec vocal à faible débit dévoilé plus tôt cette année
1 commentaires
Opus est aussi réputé pour être très bon
Impressionnant