- Exploration d’une méthode d’ingénierie inverse de motifs complexes à partir de règles locales simples
- Une approche qui combine la capacité d’apprentissage des Neural Cellular Automata (NCA) avec les Differentiable Logic Gate Networks pour obtenir, par apprentissage, des règles locales discrètes
- « Peut-on apprendre les règles du Game of Life de Conway ? »
- « Peut-on reproduire des motifs complexes comme avec les NCA et apprendre des structures récurrentes spatio-temporelles ? »
Introduction
- Les Cellular Automata (CA) partent de règles locales simples pour former des motifs complexes et difficiles à prédire
- Traditionnellement, les règles des CA étaient conçues manuellement, mais ici on présente une méthode permettant d’“apprendre” à rebours des règles locales qui satisfont un motif ou un comportement cible donné à l’avance
- En particulier, les Neural Cellular Automata (NCA) ont été conçus pour combiner la structure des CA avec des techniques de deep learning afin de permettre l’apprentissage dans un espace continu
- Les Differentiable Logic Gate Networks sont une technique qui approxime de façon continue des portes logiques (AND, OR, XOR, etc.) pour les apprendre, puis les reconvertit à la fin en circuits logiques discrets
- En combinant ces deux idées, les auteurs proposent DiffLogic CA, un modèle de CA entièrement discret et entraînable
- Cela peut être vu comme un petit pas vers la matière programmable (Programmable Matter) ou le Computronium
- L’article suit le fil conducteur suivant
- Résumé des Neural Cellular Automata
- Résumé des Differentiable Logic Gate Networks
- Structure de DiffLogic CA, qui combine les deux approches
- Expérience d’apprentissage des règles du Game of Life de Conway
- Expériences d’apprentissage pour générer des motifs complexes (damier, lézard, image couleur, etc.)
Récapitulatif – Neural Cellular Automata (NCA)
- Concept
- Un système qui remplace les règles traditionnelles des CA par une forme entraînable via un réseau de neurones
- Chaque cellule possède plusieurs canaux (états) et forme des motifs complexes via des interactions locales
- Des filtres Sobel et autres sont utilisés pour capter l’information du voisinage, puis le réseau de neurones décide des changements d’état
- Caractéristiques
- Tout le processus de calcul est différentiable, ce qui permet un apprentissage orienté vers la production d’un motif souhaité
- L’approche conserve les principes clés des CA — parallélisme, localité, calcul fondé sur l’état — tout en y ajoutant des techniques de deep learning
Récapitulatif – Differentiable Logic Gate Networks (DLGNs)
- Idée centrale
- Au lieu d’un réseau neuronal classique, l’apprentissage se fait à partir d’une approximation continue de portes logiques (AND, OR, XOR, etc.), appelée soft gate
- Pendant l’apprentissage, les portes fonctionnent de manière continue, puis lors de l’inférence finale, elles exécutent de véritables opérations binaires
- Processus d’apprentissage
- Le modèle apprend une distribution de probabilité sur les 16 opérations logiques possibles d’une porte, pour converger finalement vers une opération spécifique
- L’approximation continue rend le système différentiable, puis à la fin de l’apprentissage il est converti en portes logiques entièrement discrètes
- Avantages
- Le circuit final est composé exclusivement de portes logiques binaires, avec une forte efficacité matérielle
- La logique discrète offre des avantages en termes d’interprétabilité et d’efficacité énergétique
Differentiable Logic Cellular Automata (DiffLogic CA)
- Structure
- Dans une grille 2D, chaque cellule possède un état sur n bits, et la simulation se déroule selon les étapes Perception → Update
- Étape de Perception
- Les informations du voisinage (par canal) sont traitées par des noyaux de circuits logiques
- Étape d’Update
- L’état courant et le résultat de la Perception sont fusionnés par un autre circuit logique pour déterminer l’état au pas suivant
- Caractéristiques
- Chaque cellule agit comme un petit processeur indépendant et distribué, évoluant de manière autonome
- L’apprentissage se fait en version soft (approximation continue), puis l’inférence en portes hard (binaires), ce qui améliore l’efficacité
- L’approche partage une philosophie proche des architectures de calcul basées sur les CA comme CAM-8
Expérience 1 : Apprendre le Game of Life
- Objectif
- Apprendre les règles du Game of Life de Conway avec DiffLogic CA afin de vérifier s’il peut les reproduire parfaitement
- Configuration
- État de cellule sur 1 bit
- 16 noyaux pour la Perception (chacun avec une structure de portes 8→4→2→1)
- 23 couches pour l’Update (16 premières couches à 128 nœuds, puis [64, 32, 16, 8, 4, 2, 1])
- Apprentissage sur tous les états possibles d’une grille 3x3 (512 au total) afin de prédire exactement l’état de l’étape suivante
- Résultats
- La loss converge vers 0 et les règles locales du Game of Life sont apprises parfaitement
- Sur des grilles plus grandes, le modèle reproduit tous les motifs du Game of Life, comme les gliders ou les blocs
- Le circuit final utilise beaucoup de portes AND et OR
Expérience 2 : Génération de motifs
- Exemple du damier (Checkerboard)
- Des cellules avec un état sur 8 bits forment un damier 16x16 en 20 étapes
- 16 noyaux pour la Perception, 16 couches pour l’Update (jusqu’à 256 portes)
- La loss est calculée en comparant uniquement le canal final au motif cible
- Résultats
- Le damier est formé avec précision, et la règle est implémentée de manière concise avec seulement quelques portes
- La même règle passe sans problème à une grille 4 fois plus grande
- Même si certaines cellules sont désactivées de façon permanente, le motif se dégrade peu ; lorsqu’on les restaure, l’auto-réparation se produit automatiquement
- Asynchronisme
- Le motif en damier est appris sans difficulté même avec des mises à jour asynchrones
- Une règle apprise en mode synchrone fonctionne aussi bien en inférence asynchrone
- Les règles apprises de manière asynchrone tendent à se restaurer un peu plus vite en présence de bruit ou de dommages
Expérience 3 : Faire pousser un lézard
- Objectif
- Apprendre à former en 12 étapes la silhouette d’un lézard 20x20, afin de vérifier la capacité à générer des formes complexes
- Configuration
- État sur 128 bits
- Perception avec 4 noyaux (chacun avec une structure de portes [8, 4, 2, 1]), Update avec 10 couches (8 premières couches à 512 portes, puis [256, 128])
- Une cellule active unique au centre de la grille, avec conditions aux limites périodiques
- Résultats
- Le lézard se développe correctement même sur une grande grille (40x40)
- De très nombreuses portes sont utilisées, mais l’apprentissage reste possible avec un bon réglage des hyperparamètres
Expérience 4 : Apprendre le G en couleurs
- Objectif
- Générer sur 15 étapes une image couleur 16x16 comprenant 3 canaux RGB, afin de valider la génération de motifs multicanaux
- Configuration
- État sur 64 bits (les 3 premiers canaux servent de RGB, chaque canal valant 0 ou 1)
- Perception avec 4 noyaux (chacun [8, 4, 2]), Update avec 11 couches (8 premières couches à 512 portes, puis [256, 128, 64])
- L’image cible est un motif 16x16 en forme de G, rempli avec l’une des 8 couleurs possibles
- Résultats
- La loss converge presque à 0, et après 15 étapes le G coloré cible est reproduit avec précision
- Le circuit utilise beaucoup de portes TRUE et FALSE, avec une présence marquée des portes OR
Résumé et discussion
- Ce qui a été fait
- Proposition de DiffLogic CA, un modèle de CA entièrement discret mais entraînable
- Reproduction de règles classiques comme le Game of Life, et démonstration de la capacité à générer des motifs tels qu’un damier, un lézard ou un G coloré
- La structure en circuits logiques discrets laisse espérer à la fois une interprétation intuitive et une bonne efficacité matérielle
- Apport
- La démonstration qu’il est possible d’apprendre, sur la base de portes logiques discrètes, des motifs auto-organisés du type de ceux observés avec les NCA
- En tenant compte de propriétés comme la récupération après dommage ou les mises à jour asynchrones, l’approche semble prometteuse pour le calcul distribué et tolérant aux pannes
- Limites et pistes futures
- L’apprentissage de motifs ou d’images complexes nécessite un réglage approprié des hyperparamètres
- Il reste possible d’explorer des portes de type LSTM ou des structures capables d’oublier efficacement l’état, afin de permettre des motifs encore plus riches
- Le travail peut être étendu vers l’optimisation de la taille des circuits et l’amélioration de la stabilité de l’apprentissage
- Conclusion
- DiffLogic CA est une approche prometteuse qui pourrait mener vers des formes théoriques de calcul distribué comme la matière programmable (Programmable Matter) ou le Computronium
- À la fois entièrement discret et entraînable, il présente un potentiel comme fondation de futurs systèmes distribués
1 commentaires
Commentaires sur Hacker News