- Article sur l’obtention de 78 % de précision sur le jeu de données MNIST en moins de 10 lignes de code à l’aide de GZIP
- L’auteur souligne que la nouveauté de ce billet n’est pas d’atteindre un résultat de pointe, mais de montrer le potentiel de la compression comme outil de classification original et sans modèle
- Le code fourni utilise GZIP et la NCD (Normalized Compression Distance) comme mesure de similarité, et k-NN (k-Nearest Neighbors) pour la classification
- GZIP est utilisé comme outil pour mesurer la complexité ou le contenu informationnel de points de données individuels, tandis que la NCD fournit une mesure normalisée du degré de similarité entre deux points de données
- L’algorithme calcule la NCD avec tous les échantillons d’entraînement, les trie, puis sélectionne les
k plus petites distances. Parmi ces k=5 plus proches voisins, la classe majoritaire est prédite comme étiquette de l’échantillon de test
- L’auteur reconnaît que cette approche est coûteuse en calcul et qu’une partie seulement des images de test a été utilisée pour mesurer la précision
- L’auteur fournit également une version moins obscure de l’algorithme pour une meilleure compréhension
- L’auteur mentionne une approche similaire adoptée par Andreas Kirsch en 2019, qui avait atteint environ 35 % de précision
- L’auteur en est venu à utiliser la compression comme mécanisme de classification d’images après avoir lu un billet sur la génération de texte à partir de la compression de données, puis un article sur la classification de texte sans paramètres
- L’auteur avait déjà travaillé sur la compression d’images pour la vision par ordinateur en edge, et souhaitait appliquer cette technique au jeu de données MNIST
1 commentaires
Discussion Hacker News
gzip) avec une convolution discrète entre séquences candidates