1 points par GN⁺ 4 시간 전 | 1 commentaires | Partager sur WhatsApp
  • AV2 est la spécification de codage vidéo de nouvelle génération d’AOMedia, conçue sur la base d’AV1 pour offrir une meilleure efficacité de compression et une diffusion de haute qualité à des débits plus faibles
  • La spécification finale v1.0.0 couvre la syntaxe du bitstream, la sémantique et les procédures de décodage, et sert de référence technique pour évaluer la conformité des implémentations AV2
  • Elle est optimisée pour le streaming, la diffusion et la visioconférence en temps réel, et prend aussi en charge les applications AR/VR, la diffusion en écran partagé et l’amélioration du traitement des contenus d’écran
  • La version actuelle se compose de AV2 Bitstream & Decoding Process Specification v1.0.0, publiée le 28 mai 2026, ainsi que du logiciel de référence AVM correspondant
  • Les implémenteurs peuvent utiliser la spécification en ligne, le PDF, les tables de consultation en en-tête C, le Syntax Browser et le tag AVM v1.0.0, tandis que le brouillon v13 reste disponible à titre de référence

Présentation d’AV2

  • AV2 est la spécification de codage vidéo de nouvelle génération de l’Alliance for Open Media (AOMedia), conçue sur la base d’AV1 pour fournir une meilleure efficacité de compression
  • Son objectif est de diffuser des vidéos de haute qualité à des débits nettement plus faibles, avec une optimisation pour les besoins du streaming, de la diffusion et de la visioconférence en temps réel
  • La spécification v1.0.0 constitue la référence technique finale pour les implémentations AV2, en couvrant la syntaxe du bitstream, la sémantique et les procédures de décodage nécessaires à une conformité complète
  • AV2 prend en charge les applications AR/VR, la diffusion en écran partagé de plusieurs programmes, l’amélioration du traitement des contenus d’écran et le fonctionnement sur une plage plus large de qualité visuelle
  • AOMedia Video Model (AVM) est fourni comme logiciel de référence officiel pour les implémenteurs
  • Les retours et problèmes peuvent être envoyés à wg-codec-chair@aomedia.org ou signalés sur l’AVM issue tracker

Publication et ressources d’implémentation

  • AV2 specification and reference code v1.0.0

    • La version actuelle correspond à AV2 Bitstream & Decoding Process Specification v1.0.0, publiée le 28 mai 2026, ainsi qu’au logiciel de référence AVM associé
    • Read Online : documentation en ligne de la spécification v1.0.0
    • Download PDF : PDF complet de la spécification v1.0.0
    • Additional Tables : fichier d’en-tête C des tables de consultation extraites de la section 9
    • Syntax Browser : navigateur permettant d’explorer ensemble la structure grammaticale et la sémantique
    • Software : logiciel de référence AVM tagué v1.0.0
  • AV2 working draft v13

    • Le brouillon de travail v13 a été publié le 5 janvier 2026 et a été remplacé par la v1.0.0
    • Le libellé « v13 » désigne un jalon de brouillon de travail et ne signifie pas qu’il s’agit d’une version plus récente que la v1.0.0
    • Il est conservé à des fins de référence
    • Read Online : documentation en ligne v13
    • Additional Tables : tables additionnelles v13
    • Syntax Browser : navigateur syntaxique v13
    • Software : logiciel de référence research-v13.0.0
    • Release Notes : notes de version v13
  • Ressources d’utilisation de la spécification

    • La spécification complète couvre l’ensemble, du périmètre et des définitions jusqu’aux annexes, y compris le format, la syntaxe, la sémantique et les procédures de décodage
    • La version PDF fournit la spécification complète v1.0.0 pour une consultation hors ligne
    • Additional Tables est une ressource utile pour l’implémentation, qui extrait sous forme de fichier d’en-tête C les tables de consultation de la section 9
    • Syntax Browser fournit les Syntax Structures de la section 5 et les Semantics de la section 6 via une interface à volets partagés
    • Dans le Syntax Browser, il est possible d’afficher côte à côte les définitions syntaxiques et la sémantique, de cliquer sur les éléments de syntaxe, d’effectuer des recherches dans les deux sections et de copier les structures syntaxiques
    • Le Reference Software correspond à AVM pour la spécification v1.0.0, et le tag v1.0.0 est la version correspondante

1 commentaires

 
GN⁺ 4 시간 전
Commentaires sur Hacker News
  • AV2 n’est qu’une étape d’un très long parcours, et dans son état actuel il semble en pratique difficile à utiliser
    Même sur du bon matériel, l’encodeur tourne généralement autour de 1 fps, donc il y a de fortes chances que cela reste ainsi jusqu’à l’arrivée des premières puces avec accélération matérielle AV2 vers 2028, et il faudra sans doute attendre 2030 environ pour que les flux AV2 deviennent courants
    En termes de gain d’efficacité pur, 20 à 30 % par rapport à AV1, c’est significatif, mais il n’est pas évident qu’AV2 en vaille vraiment la peine. En revanche, la prise en charge des flux multiples est un gros avantage pour la VR et le sport en direct, et le fait de pouvoir envoyer le canal alpha dans un flux séparé puis de le recomposer dans le fichier pour gérer une vraie vidéo transparente est aussi intéressant

    • Si on regarde la trajectoire d’AV1, l’encodage matériel n’est pas forcément indispensable. C’est un plus, mais l’encodeur actuel est un encodeur de référence
      Maintenant que la spécification est finalisée, la vitesse pourrait fortement s’améliorer dans les encodeurs destinés à de vrais produits, même si l’encodage en temps réel restera probablement difficile tant qu’il n’aura pas été intégré dans du matériel dédié
    • Si « la plus grande nouveauté est la prise en charge de flux multiples », j’aurais pensé que cela relevait davantage d’un format conteneur que d’un codec vidéo
    • Au rythme actuel, je ne pense pas qu’on verra de sitôt un encodeur matériel AV2 sur PC. La quasi-totalité de la capacité de production des puces les plus récentes et les plus avancées est absorbée par Apple et les entreprises de l’IA
      À moins que les fabricants de puces ne portent les conceptions AV2 sur des procédés plus anciens et moins coûteux, cela restera difficile pour le grand public. Les fabricants chinois de puces pour téléviseurs pourront peut-être ajouter des décodeurs AV2 juste pour cocher une case, mais il paraît difficile d’espérer de vrais encodeurs avant un bon moment
    • Vu la manière dont le développement GPU se détourne vers les NPU, cela donne l’impression d’un objectif au mieux pour 2035. Les fabricants chercheront à maximiser la surface de silicium consacrée aux opérations matricielles
      À l’époque des investissements de milliers de milliards dans les datacenters, le coût du trafic passe au second plan, et les principaux gagnants pourraient n’être que YouTube ou Netflix. À cette échelle, il pourrait même être moins cher d’investir dans des caches au niveau des FAI
    • Si l’objectif est de « fournir une vidéo de haute qualité à des débits bien plus faibles », mais que les appareils lents qui en auraient réellement besoin n’existent même pas encore, je ne vois pas très bien ce que cela signifie
  • Je me demande comment AV2 va améliorer le format d’image AVIF. AVIF écrase les formats concurrents pour les images fixes à faible débit, surtout quand il y a du sous-échantillonnage de chrominance
    En revanche, ce n’est pas le cas pour les images sans perte. Comparé à JPEG XL sans perte et WEBP sans perte, AVIF sans perte en devient presque ridicule

    • AVIF est actuellement mon format d’image préféré. Il existe très peu de formats réunissant à la fois sans perte, HDR, transparence et prise en charge par les navigateurs
      Il est excellent même sur des images très fortement compressées, et il est surprenant de voir à quel point la taille des fichiers peut diminuer. Contrairement à HEIC ou à Ultra HDR JPEG, il prend en charge le HDR nativement dans le format de fichier lui-même, et non via des artifices comme des gain maps en sidecar. Ce n’est pas important pour tout le monde, mais j’aime le HDR, et AVIF donne l’impression d’être le seul format à le prendre vraiment au sérieux
    • Ce n’est pas toujours le cas https://tonisagrista.com/blog/2023/jpegxl-vs-avif/
    • Si libavif ajoute la prise en charge d’AV2, une simple mise à jour vers une version comme v2.0.0 pourrait peut-être apporter un gain d’efficacité supplémentaire
    • Honnêtement, ce dont on a besoin aujourd’hui, ce n’est pas d’AVIF2. Il y a déjà trop de formats d’image de niche
  • Aujourd’hui, plusieurs entreprises élaborent activement des claim charts pour AV1, et des poursuites semblent presque inévitables. Le même processus a déjà commencé pour AV2, mais la plupart attendent surtout que les affaires liées à AV1 mûrissent
    On continue à qualifier les codecs de la famille AV de « libres de droits », mais en pratique cela ressemble de plus en plus à un pari juridique et financier

    • On entend ce genre de discours depuis des décennies
      Je n’ai jamais compris pourquoi certains aiment voir les entreprises posséder les mathématiques comme on soutient une équipe sportive locale
      Pendant un temps, je me suis dit que c’était peut-être parce que des gens avaient investi beaucoup d’efforts dans les encodeurs H.264, et que les serfs numériques en voulaient aux défenseurs d’une liberté sale et imparfaite, par colère et par jalousie. Mais certains semblent simplement apprécier l’idée même que des entreprises puissent taxer la diffusion de vidéos
      Heureusement, ces entreprises cupides se sont plusieurs fois tiré une balle dans le pied, et leur influence est en train de diminuer
    • Cela fait combien de temps qu’AV1 existe ? Environ 8 ans, et il n’y a toujours pas de titulaire de brevet crédible
      Il y a toujours des vautours qui tournent autour des standards de compression, donc il ne faut pas prendre cela trop au sérieux. Même si un procès était lancé, il existe un fonds de défense juridique pour contrer les revendications infondées
    • Si les codecs de la famille AV ressemblent à un pari juridique et financier, quelle est l’alternative ?
      H.265 a deux pools de licences HEVC auxquels il faut adhérer, et il existe aussi au moins deux entreprises hors pool
      https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#P...
      Choisir un codec qui n’est pas un AVx ne semble pas rendre les choses moins complexes ni réduire le risque de poursuites
    • Tu veux dire que c’est le cas même comparé à quelque chose comme HEVC ? Pour être tranquille avec HEVC, il faut payer 3 pools de brevets aux conditions différentes, et en plus des détenteurs de brevets hors pool peuvent à tout moment réclamer des royalties selon leurs propres conditions
    • Les standards de communication ne devraient pas pouvoir être brevetés. Le potentiel d’abus via l’effet de verrouillage est trop grand
  • Combien de temps avant que quelqu’un implémente ce standard, se fasse attaquer en justice parce qu’Adobe ou Dolby veut faire un exemple, et se retrouve poursuivi ? Il est possible que mes connaissances soient dépassées, mais si c’est aussi « ouvert » qu’AV1, je reste assez sceptique sur le fait que chaque entreprise l’accepte réellement. La cupidité existe aussi

    • Il a fallu 7 ans pour que la première revendication de brevet sur AV1 arrive jusqu’au tribunal, et il faudra sans doute encore du temps avant que cette affaire soit réglée
      Fait intéressant, elle ne venait pas du pool de brevets qui a fait la une de l’actualité ces dernières années. Autrement dit, il peut s’écouler longtemps avant qu’une tentative de ce genre n’apparaisse
    • Les patent trolls sont ignobles. Combien de temps leur faudra-t-il pour obtenir le soutien total de ceux qui sapent l’indépendance du système judiciaire américain à leur propre profit ? Espérons que cette corruption soit stoppée avant cela
  • C’est à moitié une blague, mais j’attendais une Apple TV compatible AV1, et maintenant me voilà aussi à attendre la prise en charge d’AV2 sur l’Apple TV

  • Je ne suis pas spécialiste de l’encodage vidéo, mais je me demande si à l’avenir on ne s’appuiera pas davantage sur des réseaux d’IA qui reconstruisent l’image, au lieu de schémas de compression à fonction fixe, pour obtenir quelque chose de bien plus léger qu’une vidéo compressée classique
    Les codecs neuronaux comme github.com/Orange-OpenSource/Cool-Chic en sont un exemple

    • Cela dépendra sans doute de la généralisation des NPU dans les smartphones, et de l’apparition d’API standard pour y accéder
      Cela dit, je ne sais pas si des codecs basés sur l’IA pourront rivaliser avec du matériel à fonction fixe en matière de consommation de batterie
  • AV1 était déjà un grand bond en avant vers un format vidéo efficace et ouvert, et j’attendais AV2 depuis longtemps
    Il faudra du temps avant qu’il soit implémenté dans les puces et le matériel, et qu’on puisse profiter d’un encodage/décodage matériel efficace et rapide, mais vu la hausse du prix du stockage et la crise des puces, un gain d’efficacité d’environ 25 % semble très prometteur

  • Dav2d sonne nettement moins bien. J’aimerais que, d’ici là, quelqu’un de doué pour les jeux de mots dans les noms de dépôts propose quelque chose
    avi2ude ? av2go ?

    • rav2d a l’air correct — https://github.com/stukenov/rav2d. C’est un port Rust, dans le même esprit que rav1d→dav1d
    • Il a été difficile de trouver un bon nom avec av2
      En français, ce serait d2vid, soit Deuvid
  • J’espère qu’un encodeur assez rapide sortira. L’encodeur de référence d’AV1 n’était déjà pas terrible, et cela semble être encore le cas ici
    Mais dès qu’un équivalent de SVT-AV2 arrivera, je pense que j’en serai très content