10 points par xguru 2024-04-11 | 5 commentaires | Partager sur WhatsApp
  • Nouveau projet de Bellard, le créateur de FFMPEG/QEMU
  • TSAC est un utilitaire de compression audio qui offre une bonne qualité sonore tout en atteignant des débits binaires très faibles, comme 5,5 kb/s en mono ou 7,5 kb/s en stéréo à 44,1 kHz
  • TSAC peut compresser une chanson stéréo de 3,5 minutes en un fichier de 192 KiB
  • Un GPU Nvidia est nécessaire pour un fonctionnement rapide ; l’outil est aussi compatible CPU seul, mais avec des performances plus lentes

Informations techniques

  • TSAC repose sur une version modifiée du Descript Audio Codec étendue à la stéréo, ainsi que sur un modèle Transformer pour augmenter encore le taux de compression. Les deux modèles sont quantifiés à 8 bits par paramètre
  • Le modèle Transformer est évalué de manière déterministe et reproductible, de sorte que le résultat ne dépend ni du modèle exact de GPU ou de CPU, ni du nombre de threads configurés. Autrement dit, les fichiers compressés peuvent être décompressés avec des configurations matérielles ou logicielles différentes.

5 commentaires

 
botplaysdice 2024-04-11

En regardant le site, on voit qu’il s’est aussi brièvement intéressé aux LLM ;;;; Ce genre de personne sur une technologie aussi récente ? C’est ce que je me suis dit, avant de me dire qu’au fond, l’IA est bien la grande tendance du moment.

 
xguru 2024-04-11

Si je mets à jour la présentation que j’avais écrite auparavant sur cet incroyable personnage qu’est Fabrice Bellard..

Fabrice Bellard

Développement de LZEXE en 1989

Harissa en 1996 — à la fois machine virtuelle Java et compilateur de code Java vers C

Publication en 1997 d’une formule permettant de déterminer une certaine décimale de pi (π) en écriture binaire.
-> calcul sans déterminer du tout les chiffres précédents. Le billionième chiffre est « 1 »
https://en.wikipedia.org/wiki/Bellard%27s_formula

Présentation de TinyGL en 1998 — une implémentation OpenGL petite et embarquable

Présentation de FFMpeg en 2000. La plupart des lecteurs vidéo que nous utilisons aujourd’hui s’en servent.

Victoire à l’IOCCC en 2000 avec un code C de 448 octets trouvant le plus grand nombre premier. Ce nombre premier est resté le plus grand découvert jusqu’en 2016.

Présentation de Tiny C Compiler en 2001 — un compilateur C ultra-léger

Présentation de QEmacs en 2002 — un clone ultra-léger d’Emacs. Rendu et modification WYSIWYG de HTML/XML/CSS2 possibles (avec moteur de navigateur intégré)

Présentation de QEMU en 2003 — un émulateur CPU doté de fonctions de virtualisation matérielle

Présentation de TinyCC Boot Loader en 2004 — un bootloader capable de démarrer en compilant directement le noyau Linux

Présentation en 2005 d’un générateur de signal DVB-T : permet d’émettre de la télévision numérique depuis un desktop à la place d’un émetteur coûteux. Le code source n’a pas été publié

En 2009, il a établi un record du monde en calculant 2,7 billions de décimales de π. Apparemment, il a fait tourner le calcul pendant 131 jours sur son propre desktop.
-> il a dit que c’était moins par intérêt pour les grands nombres que comme défi de programmation informatique.

Présentation de JSLinux en 2011. Une version de Linux s’exécutant dans le navigateur web.

En 2019, présentation de QuickJS JavaScript Engine, un moteur JavaScript petit, rapide et embarquable

En 2022, publication de TextSynth, un SaaS créé à l’aide de gpt2tc (GPT-2)

Entre autres, BPG, un format d’image basé sur HEVC offrant un meilleur taux de compression que JPG (avec décodeur JavaScript fourni, donc utilisable dans n’importe quel navigateur)

Il a aussi mis en œuvre à bas coût, sur base PC, des stations de base 4G LTE/5G NR, ensuite commercialisées via sa propre société Amarisoft

C’est le genre de personne qui fait se demander, à chaque projet, comment tout cela peut être l’œuvre d’un seul homme.

 
mdisprgm 2024-04-11

Waouh..

 
botplaysdice 2024-04-11

Un jour, dans un post sur HN à propos du code écrit par cette personne...

Quelqu’un avait demandé : « Pourquoi Bellard ne poste-t-il pas ici (sur HN) ? », et il y avait des réponses du genre : « Tu crois vraiment qu’une personne aussi productive viendrait ici pour écrire des posts ? » … haha

C’est vraiment un monstre....

 
xguru 2024-04-11

Avis Hacker News

Résumé :

  • Les réactions au nouveau codec audio TSAC de Bellard sont largement positives. Ses performances à très bas débit sont notamment supérieures à celles des codecs existants.
  • Endommager un fichier compressé par TSAC produit des résultats intéressants. Le son diffère entre le mode Fast et le mode normal.
  • Un GPU NVIDIA est nécessaire pour le traitement en temps réel, et le décodage sur appareil mobile peut être coûteux. Son usage sur des systèmes embarqués peu puissants semble donc limité.
  • La taille du fichier compressé du décodeur TSAC, qui atteint 237 MB, suscite l’étonnement. Certains se demandent si des échantillons audio ne sont pas inclus dans le décodeur.
  • Une comparaison avec des codecs prenant en charge des débits encore plus faibles, comme Codec2, suscite de la curiosité.
  • Le développeur de DAC, le codec de base de TSAC, a également commenté TSAC. La méthode d’amélioration utilisant un Transformer est jugée intéressante.
  • Le fonctionnement de TSAC ressemble à celui des modèles d’IA de génération musicale. Certains génèrent la musique en injectant des tokens dans un modèle de langage, tandis que d’autres remplacent la tokenisation en fournissant une représentation continue pour les modèles de diffusion.
  • Des questions sont soulevées sur le caractère déterministe et reproductible de la méthode d’évaluation de TSAC. On se demande notamment s’il utilise des nombres en virgule flottante et de la concurrence. Un portage vers les GPU AMD pourrait affecter ce comportement déterministe.
  • La plupart des technologies de compression multimédia se concentrent sur les scénarios à bas débit. Certains s’interrogent sur le niveau d’amélioration obtenu à haut débit, par exemple par rapport à l’écart de performances entre l’AAC à 256 kbps et l’AV1 à 10 Mbps.