2 points par GN⁺ 2024-06-14 | 1 commentaires | Partager sur WhatsApp
  • Meta prend en charge la communication en temps réel (RTC) pour des milliards de personnes via des applications comme WhatsApp, Instagram et Messenger.
  • L’entreprise cherche à offrir une expérience de haute qualité même aux utilisateurs qui n’ont ni connexion rapide ni smartphone récent.
  • Meta a développé le codec Meta Low Bitrate (MLow), qui améliore la qualité audio même sur des connexions lentes.

Motivation du développement d’un nouveau codec

  • L’utilisation massive de la RTC dans les produits Meta a permis d’observer les performances des codecs dans divers scénarios réseau.
  • De nombreux appels ont lieu dans des conditions de connexion réseau médiocres.
  • Le codec Opus ne fournit pas une qualité audio suffisante à faible débit.
  • Les nouveaux codecs audio basés sur le ML offrent une bonne qualité à faible débit, mais leur coût de calcul est problématique.
  • Comme beaucoup d’utilisateurs utilisent des appareils d’entrée de gamme, il est nécessaire de disposer d’un codec audio de haute qualité avec de faibles besoins de calcul.

Le codec MLow

  • Le codec MLow offre une qualité deux fois meilleure qu’Opus, avec une complexité de calcul inférieure de 10 %.
  • MLow est déjà entièrement déployé sur Instagram et Messenger, et son déploiement est activement en cours sur WhatsApp.
  • Il permet d’encoder un audio de haute qualité même à faible débit, ce qui améliore fortement la qualité audio dans les scénarios de perte de paquets.

Architecture interne de MLow

  • MLow utilise des techniques avancées fondées sur les concepts des codecs CELP (Code Excited Linear Prediction).
  • Le signal d’entrée est divisé en bandes de basses et de hautes fréquences, qui sont encodées séparément.
  • La bande haute fréquence est encodée avec peu de bits, ce qui permet de proposer du SuperWideBand (échantillonnage à 32 kHz) à faible débit.

Suite du programme

  • MLow améliore fortement la qualité audio, y compris sur les appareils d’entrée de gamme.
  • L’objectif est de fournir plus efficacement davantage d’audio redondant afin d’améliorer la récupération audio sur les réseaux avec beaucoup de pertes de paquets.

L’avis de GN⁺

  • Atouts de MLow : il offre une qualité audio élevée même sur des connexions lentes, ce qui améliore fortement l’expérience utilisateur.
  • Défi technique : maintenir une haute qualité avec une faible complexité de calcul est un défi technique particulièrement difficile.
  • Produits concurrents : il existe divers codecs audio au-delà d’Opus, mais MLow offre d’excellentes performances même sur les appareils d’entrée de gamme.
  • Points à considérer pour l’adoption : lors de l’introduction d’un nouveau codec, la compatibilité avec les systèmes existants et les tests de performance sont essentiels.
  • Impact utilisateur : cela peut apporter de grands bénéfices aux nombreux utilisateurs qui utilisent des appareils d’entrée de gamme.

1 commentaires

 
GN⁺ 2024-06-14
Avis Hacker News
  • Nouveaux codecs à faible débit binaire : pour la communication en temps réel, le débit de paquets doit être élevé afin de réduire la latence, ce qui peut faire en sorte que la surcharge dépasse la charge utile réelle. Cela peut toutefois être utile pour les communications à commutation de circuits ou les systèmes VoIP utilisant la compression d’en-tête.

  • Partage de la recherche par Meta : il semble que Meta regagne en popularité en partageant beaucoup de recherche et de travaux open source. La réputation de Facebook était mauvaise, mais cela semble l’avoir en partie rachetée.

  • Absence de comparaison avec Codec2 : l’absence de comparaison avec Codec2 amène à douter de la valeur réelle et de la motivation de ce travail. Il n’y a pas besoin d’un nouveau codec audio enfermé dans une propriété intellectuelle supplémentaire.

  • Comparaison avec Google Meet : Google Meet gère bien les appels audio même sur une connexion lente, et on se demande si ce codec fait mieux que Google Meet. La technologie de Google Meet n’a pas été rendue publique.

  • Qualité des appels téléphoniques : on peut se demander pourquoi les appels téléphoniques actuels sont moins clairs que le μ-law ADPCM 8 kHz 8 bits des années 1990.

  • Absence de comparaison avec Pied Piper : aucune comparaison avec Pied Piper.

  • Disponibilité : on se demande si ce codec va être réellement publié ou s’il s’agit simplement d’une démonstration technique. Meta AI Research est innovant, mais il est difficile de trouver d’autres références à ce codec.

  • Licence : aucune information sur la licence.

  • Aucune mention de NoLACE : comme NoLACE n’est pas mentionné, les échantillons de comparaison sont moins utiles.

  • Comparaison avec Opus : Opus semble produire un son plus doux à 6 kbps, tandis que les échantillons MLow présentent des artéfacts plus rugueux et artificiels. À des débits plus élevés, le choix serait probablement plus net.