2 points par GN⁺ 2024-05-15 | 1 commentaires | Partager sur WhatsApp

Sir, there's a cat in your mirror dimension

  • J’ai déjà parlé auparavant du domaine fréquentiel.

    • C’est une technique qui convertit un signal du quotidien en amplitudes de ses formes d’onde constitutives.
    • La base la plus courante repose sur des ondes sinusoïdales de fréquence croissante.
    • De nombreuses autres formes d’onde peuvent aussi produire différents domaines fréquentiels.
  • Deux propriétés importantes des transformations vers le domaine fréquentiel :

    • Réversibilité : on peut restaurer les données d’origine à partir de l’image fréquentielle.
    • Symétrie entrée/sortie : la transformation peut se faire dans les deux sens avec la même opération mathématique.
  • En pratique, cette distinction est importante.

    • Elle est particulièrement importante pour la compression.
    • Si l’on convertit une image dans le domaine fréquentiel et que l’on réduit la précision des composantes haute fréquence, la quantité de données diminue.
    • L’image résultante paraît pourtant toujours identique à l’œil.

Utiliser MS Paint comme outil de compression de pointe

  • Une image dans le domaine fréquentiel ressemble à du bruit diffus.

    • La majeure partie n’a pas d’importance visuelle.
    • La transformation agit comme un levier entre deux dimensions fonctionnellement équivalentes.
    • Je me suis alors demandé s’il serait possible d’habiter cette dimension miroir et d’y déplacer certaines données.
  • Pour tester cela, j’ai pris une photo de chat et calculé sa représentation dans le domaine fréquentiel avec une transformée en cosinus discrète (DCT).

    • Chat temporel, chat fréquentiel.
  • J’ai repris la photo de la femme de l’exemple précédent et superposé le motif de « bruit de chat » de la dimension miroir en réduisant son opacité.

    • Femme temporelle et chat fréquentiel.
  • Une composition de ce type entraîne inévitablement des pertes.

    • En théorie, si l’on calcule par DCT la représentation fréquentielle de l’image composite, la photo de la femme devrait se décomposer en bruit uniforme.
    • Le « bruit de chat » injecté devrait, lui, se regrouper en une image de chat reconnaissable.
  • Et c’est effectivement ce qui se passe.

    • Chat fréquentiel et femme temporelle.
  • Pour le vérifier vous-même, il suffit de télécharger l’image composite et d’exécuter ce qui suit dans MATLAB :

    woman = imread("woman-with-cat.png");  
    colormap('gray');  
    imagesc(woman, [0 255]);  
    pause(1);  
    cat = dct2(woman);  
    imagesc(imgaussfilt(cat, 1), [-4 4]);  
    
  • Fait intéressant, le chat survit aussi au redimensionnement du document hôte.

    • L’agrandissement met l’image en mosaïque.
    • La réduction recadre l’image.
  • Je me suis demandé dans quelle mesure la compression avec pertes endommagerait le chat.

    • L’effet a été moindre que prévu.
    • Avec un réglage JPEG de qualité élevée, l’image reste assez correcte.
    • Quand le réglage de qualité baisse, le quadrant inférieur droit est fortement quantifié.
    • Le chaos de la compression JPEG vu dans le domaine fréquentiel.
  • Cette visualisation montre à quel point l’algorithme JPEG détruit de l’information.

    • Nous ne remarquons pourtant pas l’essentiel de ces pertes.
  • Il existe déjà de nombreux exemples utilisant des spectrogrammes audio comme messages cachés.

    • On trouve aussi des discussions sur la stéganographie textuelle à l’aide des coefficients DCT de JPEG.
    • L’idée n’est pas tant que cette technique soit particulièrement utile, mais plutôt de souligner le lien amusant entre domaine fréquentiel et domaine temporel.

L’avis de GN⁺

  1. Comprendre la transformation dans le domaine fréquentiel : les transformations dans le domaine fréquentiel jouent un rôle important dans la compression de données et le traitement du signal. Les comprendre aide à traiter plus efficacement les images et l’audio.
  2. Utilisation de MATLAB : MATLAB est un outil puissant pour l’analyse et la visualisation de données. Cet article permet de découvrir un exemple pratique de son utilisation.
  3. Les limites de la compression JPEG : on peut visualiser concrètement les limites de la compression JPEG. Cela aide à trouver des moyens de réduire la taille des fichiers tout en préservant la qualité d’image.
  4. Stéganographie : la stéganographie utilisant le domaine fréquentiel est un sujet intéressant en lien avec la sécurité des données. Elle permet d’apprendre comment transmettre des messages cachés.
  5. Des applications ludiques de la technologie : cet article montre comment appliquer la technologie de manière amusante et créative. Cela peut renforcer l’intérêt pour la technique et faire naître de nouvelles idées.

1 commentaires

 
GN⁺ 2024-05-15
Avis Hacker News

Résumé d’une sélection de commentaires Hacker News

  • Sujet de la photo et énergie spectrale :

    • Dans la plupart des photos, le sujet reconnaissable concentre l’énergie spectrale près de l’origine (en haut à gauche).
    • Le sujet d’une photo est généralement placé au centre du cadre, ce qui minimise les interférences entre les données des domaines spatial et fréquentiel.
  • Bases du tatouage numérique :

    • Cette technique constitue une base pour le tatouage numérique robuste de signaux comme les images ou l’audio.
    • L’application principale consiste à détecter des contenus protégés par le droit d’auteur même après un traitement important du signal.
  • Dualité temps-fréquence de la transformée de Fourier :

    • Le principe mathématique de la transformée de Fourier fonctionne de la même manière quelle que soit la direction de la transformation.
    • Si l’on insère le tracé fréquentiel du chat dans la représentation spatiale de la femme, la transformée de Fourier de la femme fera apparaître le chat.
  • Demande de vérification du procédé :

    • On prend une photo, on convertit le chat dans le domaine fréquentiel, puis on le compose avec l’image visuelle de la femme.
    • Si l’on applique ensuite à nouveau une DCT à l’image composite, le chat apparaît.
  • Application à la stéganographie :

    • Une application intéressante de la stéganographie pour dissimuler des images illégales.
    • En convertissant une image dans le domaine fréquentiel puis en la composant avec une autre, seules les personnes sachant comment inverser le procédé peuvent la voir.
  • Le tour du spectrogramme audio d’Aphex Twin :

    • Cela rappelle un truc amusant d’Aphex Twin, qui faisait apparaître un visage étrange dans le spectrogramme audio d’un morceau.
  • Importance de la position en DCT :

    • Si le chat avait été davantage concentré en haut à gauche, cette démo n’aurait probablement pas bien fonctionné.
    • La DCT contient beaucoup de composantes haute fréquence, donc placer le chat en haut à gauche risquerait de le noyer.
  • Compréhension de la compression d’image :

    • Certains découvrent que le domaine fréquentiel peut être utilisé pour la compression d’image.
    • Ils se demandent si la plupart des algorithmes de compression d’image fonctionnent en supprimant les parties calmes du domaine fréquentiel.
  • Méthode spécifique de la DCT :

    • Il semble que la DCT ait été appliquée autrement qu’avec les tuiles 8x8 utilisées dans JPEG.
    • Il semble que les fonctions de base de la DCT 2D n’aient pas été utilisées dans ce cas.
  • Encodage d’images dans la musique :

    • Cela ressemble à la manière dont Aphex Twin et Venetian Snares ont encodé des images dans le son.
    • Avec certains outils, on peut voir que les fréquences forment l’image d’un chat.