L’IA apprend la « magie noire » de la conception RFIC
(spectrum.ieee.org)- Les RFIC sont à la base des technologies sans fil comme la 5G, le radar automobile et les communications par satellite, mais restent un problème difficile largement manuel, car il faut concilier électromagnétisme, thermique et fiabilité du packaging
- Des chercheurs de Princeton ne partent pas de modèles de conception humains : ils combinent apprentissage par renforcement et conception inverse pour explorer dès le départ l’architecture, la topologie des circuits, les paramètres des composants et les interfaces électromagnétiques
- Un émulateur fondé sur l’IA prédit en quelques millisecondes les paramètres de diffusion de structures électromagnétiques 2D arbitraires, réduisant fortement les itérations qui prennent des minutes à des heures avec les solveurs électromagnétiques classiques
- En 2023, sur un amplificateur de puissance millimétrique 30–100 GHz, l’approche a obtenu ce qui était alors la meilleure combinaison bande passante, puissance de sortie et rendement parmi les amplificateurs de puissance sur silicium ; en 2024, elle a aussi généré des structures d’IC multiports en quelques minutes
- L’IA peut aussi produire des circuits qui ne fonctionnent pas, la validation nécessite donc une supervision humaine ; pour aller vers un modèle généraliste, il faut un écosystème ouvert permettant de partager des données de conception RFIC et analogique aujourd’hui couvertes par des NDA
Pourquoi la conception RFIC reste de la « magie noire »
- Les RFIC sont les circuits essentiels qui permettent aux appareils d’envoyer et de recevoir des informations sans fil, et les progrès des voitures autonomes, des communications quantiques, de la 6G et des communications par satellite dépendent eux aussi de puces RF plus avancées
- La conception de CPU ou de GPU s’est rapprochée d’une science standardisée, mais la conception RF reste fortement marquée par un savoir-faire manuel acquis avec de longues années d’expérience
- La conception RFIC traite simultanément plusieurs domaines physiques
- Les équations de Maxwell régissent la manière dont les champs électromagnétiques interagissent avec les composants actifs et passifs
- La thermodynamique détermine la manière dont la chaleur est produite et évacuée pendant le fonctionnement
- La dilatation et la contraction thermiques sont liées à la capacité de la puce et du boîtier à rester stables face aux variations de température
- Comme toutes ces contraintes physiques doivent être prises en compte ensemble, l’espace de conception est très vaste, et améliorer un indicateur de performance dégrade souvent un autre indicateur, créant des compromis
Flux traditionnel de conception RFIC et goulets d’étranglement
- Pour concevoir un amplificateur de puissance 28 GHz destiné à un combiné 5G millimétrique, il faut d’abord définir l’architecture et la topologie du circuit
- L’architecture d’un RFIC définit, comme le plan d’une maison, les composants nécessaires et les chemins de signal
- Dans un amplificateur de puissance, le nombre d’étages d’amplification devient un élément important
- La majeure partie de la surface d’un RFIC est occupée non pas par les transistors, mais par des composants passifs comme les inductances et les lignes de transmission, ainsi que par des structures électromagnétiques
- Les signaux 5G fonctionnent à 28 GHz et 39 GHz, les communications par satellite à 26,5–40 GHz et au-delà, et les radars automobiles à 77 GHz ; à ces hautes fréquences, les RFIC gèrent l’énergie du signal au moyen de structures électromagnétiques sophistiquées
- Si le chemin du signal n’est pas correctement adapté au composant suivant, un problème d’adaptation d’impédance apparaît : l’énergie ne progresse pas vers l’avant et se réfléchit vers l’arrière
- Les ingénieurs conçoivent de fines structures de transition entre les composants afin de réduire les réflexions
- Ces structures peuvent servir non seulement à transmettre le signal, mais aussi à le diviser, le combiner et le distribuer sur plusieurs chemins
- Si les spécifications ne sont pas satisfaites, il faut modifier à nouveau la topologie ou l’architecture et répéter les simulations ; la conception d’une nouvelle puce peut prendre des années et coûter de plusieurs dizaines à plusieurs centaines de millions de dollars
Une approche de conception par IA qui sort des modèles
- Les travaux existants utilisaient le machine learning pour optimiser des modèles de circuits, mais dépendaient encore de bibliothèques de conceptions existantes créées par des humains
- L’objectif des chercheurs de Princeton est de laisser l’algorithme définir, dès le départ et sans topologie prédéfinie, tous les paramètres de l’architecture, des circuits constitutifs et des structures passives électromagnétiques
- Cette méthode part d’un point de départ différent de l’optimisation classique
- L’approche classique ajuste des paramètres comme la taille des transistors ou la forme des composants passifs dans une structure créée par des humains
- La nouvelle approche crée des combinaisons de circuits candidates à partir d’un point de départ presque vide, cartographie les compromis de performance et explore l’espace de conception
- Comme AlphaGo Zero, l’approche fait évoluer ses stratégies de conception par exploration et évaluation propres, plutôt qu’en imitant des exemples humains
- L’algorithme apprend les circuits, l’électromagnétisme et leur co-conception, avec pour objectif une conception RFIC end-to-end
Combiner apprentissage par renforcement et conception inverse
- La première étape est un framework d’apprentissage par renforcement, qui détermine l’architecture système optimale, la topologie des circuits, les paramètres des composants et les caractéristiques des interfaces électromagnétiques
- L’agent d’apprentissage par renforcement essaie différentes combinaisons comme un ordinateur qui apprend un jeu, observe la relation entre actions et scores, puis cherche de meilleurs circuits
- L’apprentissage prend de quelques jours à une semaine
- Une fois l’apprentissage terminé, il peut concevoir des circuits très rapidement
- La deuxième étape est la conception inverse, qui recherche la structure électromagnétique physique produisant les paramètres de diffusion souhaités
- Les paramètres de diffusion mesurent si un signal progresse vers l’avant ou se réfléchit vers l’arrière lorsqu’il entre dans un composant
- C’est similaire, en génie des structures, à la recherche d’arches ou de structures de support pour créer un espace cible
- La conception inverse de RFIC doit faire correspondre simultanément le fonctionnement du circuit et la réponse électromagnétique des interconnexions et composants passifs ; il est donc difficile de la résoudre par une exploration manuelle itérative
Comment l’émulateur IA réduit les itérations de conception électromagnétique
- Les chercheurs ont remplacé le simulateur de circuits RF par un émulateur fondé sur l’IA
- Ce modèle reçoit en entrée une structure 2D arbitraire et prédit ses paramètres de diffusion sans calculer directement les équations de Maxwell
- Il ramène à quelques millisecondes une tâche qui prenait de quelques minutes à plusieurs heures avec les solveurs électromagnétiques classiques
- L’émulateur est construit à partir de réseaux neuronaux convolutifs, efficaces pour le traitement d’images
- L’image de la structure contient des informations spatiales permettant de prédire ses performances électromagnétiques
- Les chercheurs ont entraîné le modèle sur de nombreuses structures aléatoires en pixels, étiquetées avec leurs paramètres de diffusion
- En combinant conception inverse par apprentissage par renforcement et émulateur IA, ils ont construit un concepteur IA end-to-end et l’ont appliqué à la conception d’amplificateurs de puissance
Des architectures RF différentes de celles des humains
- La preuve de concept publiée en 2023 ciblait des amplificateurs de puissance en bande millimétrique de 30 à 100 GHz
- Cette plage couvre la plupart des fréquences pertinentes pour la 5G et le radar
- La conception finale présentait alors la meilleure combinaison de wide bandwidth, output power et efficiency parmi les amplificateurs de puissance sur silicium, tout en conservant un record efficiency
- Les chemins électromagnétiques générés ressemblaient à des motifs arbitraires ou à des QR codes, contrairement aux structures régulières et symétriques que les humains envisagent généralement
- Ce résultat montre que rien ne garantit que les modèles utilisés historiquement soient proches de l’optimum pour les objectifs de conception modernes
- Les chercheurs ont ensuite étendu le modèle à des structures comportant de nombreux ports d’entrée et de sortie
- 2 ports impliquent 4 paramètres de diffusion, 4 ports en impliquent 16, ce qui fait croître rapidement la complexité
- Dans une étude de 2024 sur les multiport integrated circuits, ils ont montré que l’algorithme d’IA pouvait aussi gérer des structures multiports
- Auparavant, la simulation électromagnétique multiport nécessitait des jours, voire des semaines ; ce modèle fait évoluer de nouvelles structures en quelques minutes
- En combinant framework d’apprentissage par renforcement et conception inverse, ils ont démontré un flux allant des spécifications jusqu’au fabrication-ready layout, appliqué à des amplificateurs à faible bruit, au subterahertz et à des power amplifiers broadband
Une conception IA interprétable
- Les tests et le débogage de RFIC peuvent prendre autant de temps que la conception, voire être plus difficiles ; les ingénieurs préfèrent donc des structures interprétables qu’ils peuvent comprendre et corriger en cas de problème
- Les chercheurs ont appliqué à la génération de structures RFIC les diffusion models utilisés dans l’IA de génération d’images
- Au lieu de prompts textuels, ils utilisent en entrée les paramètres de diffusion et génèrent en sortie la structure électromagnétique du RFIC
- Ils ont inclus dans l’entrée un cadran de fréquence spatiale permettant au concepteur de contrôler la forme de la structure résultante
- Faible fréquence spatiale : forme classique et interprétable
- Fréquence spatiale intermédiaire : structure de type labyrinthe
- Fréquence spatiale élevée : structure pixellisée ou proche d’une forme arbitraire
- L’ensemble du processus, du prompt à la sortie, prend environ 6 minutes et peut générer une structure correspondante pour des paramètres de diffusion physiquement réalisables sous les équations de Maxwell
Limites restantes et défi des données
- Les approches de conception fondées sur l’IA ont suscité l’intérêt de la communauté RF et commencent à renverser le flux de conception bottom-up traditionnel
- Des questions restent ouvertes
- Jusqu’où la méthode peut-elle se généraliser ?
- Peut-elle produire régulièrement de hautes performances ?
- Peut-elle optimiser globalement tous les compromis possibles ?
- Peut-elle inventer, au-delà des RFIC, d’autres circuits jamais créés par des humains ?
- L’IA peut avoir des hallucinations en générant de mauvais circuits qui ne fonctionnent pas ; la validation nécessite donc toujours une supervision humaine
- Pour créer un foundational model généraliste, il faut de grands volumes de données permettant d’apprendre les lois qui gouvernent l’électromagnétisme et le fonctionnement des circuits
- ImageNet, avec 14 millions d’images diverses étiquetées par des humains, est un exemple qui a permis la généralisation des modèles de reconnaissance d’images
- La conception RFIC et analogique a elle aussi besoin de données d’une ampleur et d’une diversité similaires
- Ces données existent en grand nombre dans les simulations d’entreprises et de laboratoires du monde entier, mais la plupart sont enfermées derrière des NDA
- Natcast opérait le programme R&D du U.S. CHIPS and Science Act et aurait pu renforcer l’innovation et les infrastructures partagées pour les technologies sans fil, de détection et de défense de nouvelle génération, mais l’organisation et le programme lié au machine learning et aux RFIC ont été arrêtés
- Si le domaine des RFIC élargit la collaboration entre chercheurs en IA et concepteurs de puces et crée un écosystème ouvert, il pourra mieux exploiter le potentiel de la conception d’IC fondée sur l’IA
1 commentaires
Avis sur Hacker News
Ça me rappelle les anciennes recherches par algorithmes génétiques. Une approche par conjecture et vérification peut être assez puissante, surtout si l’on peut y ajouter le guidage d’un agent en cours de route
https://en.wikipedia.org/wiki/Evolved_antenna
Pour commencer : https://sci-hub.ru/storage/moscow/4324/11d145b2c2c3ab320f70b...
Je me demande si l’attente courante selon laquelle une vraie théorie doit être quelque part belle et élégante survivra au siècle qui vient. Et si les phénomènes naturels réels étaient en fait mieux décrits par un amas d’équations terriblement brouillon, que seules les machines peuvent manipuler et raisonner ? Ce serait assez triste
La blague des physiciens qui supposent une « vache parfaitement sphérique » va dans ce sens, et le cœur de l’essai sur « l’efficacité déraisonnable des mathématiques » en est en fait assez proche. L’idée est qu’il est déraisonnablement surprenant que des approximations mathématiques décrivent si bien le monde
Le rasoir d’Occam est une heuristique utile, mais il nous biaise aussi vers les explications les plus simples
L’un des excellents usages de la conception par IA, c’est la pollution des brevets. On peut générer massivement des variantes de conceptions avec l’IA et les publier sur un site web ; plus tard, si un brevet apparaît, on peut utiliser les recoupements pour l’invalider ou au moins en réduire la portée. Car la généralisation d’un brevet est limitée par l’état de la technique antérieur
Il a ensuite expliqué son raisonnement lors d’un événement TEDx local, ce qui a attiré une certaine attention [1], et je me souviens que les commentateurs juridiques étaient plutôt sceptiques, en disant que les juges distinguent couramment des différences bien plus fines que cela. Mais c’était quand même une tentative amusante
[0] https://allthemusic.info/
[1] https://m.youtube.com/watch?v=sJtm0MoOgiU and
https://www.the-independent.com/tech/music-copyright-algorit...
C’est un peu frustrant. L’IA peut faire beaucoup de choses, mais en mélangeant sans cesse les LLM avec Monte-Carlo, les algorithmes génétiques, les systèmes experts et autres formes de sorcellerie statistique relevant du machine learning traditionnel, on amalgame de manière trop agressive des activités de machine learning déjà établies et moralement neutres avec les inquiétudes autour des LLM et de Stable Diffusion
Et je me dis que c’est peut-être intentionnel
Quand on veut dire qu’il y a eu une grande avancée dans quelque chose, se raccrocher à cette compréhension vulgarisée selon laquelle la SF prédit les réussites humaines demande peu d’efforts et produit beaucoup d’effet. Si l’objectif numéro un est d’enthousiasmer les gens, ce n’est pas de communiquer avec exactitude
L’expression « les humains n’auraient même pas pu l’imaginer » me paraît exagérée. Cela dit, il semble tout à fait possible qu’un algorithme d’apprentissage automatique puisse, par recherche exhaustive, aboutir à une conception de puce que personne n’a encore essayée, et que certaines d’entre elles nous soient utiles. C’est une tâche assez raisonnable à confier à un ordinateur
Une chose qu’on peut retenir de l’article, c’est qu’il a fallu abandonner les blocs de base éprouvés de la conception de puces pour obtenir ces avancées. Je me demande si la même chose vaut pour le codage ordinaire. Les innovations étonnantes du codage par IA sont-elles en réalité freinées par Rust et Python ? Faut-il laisser les outils d’IA coder tout simplement au niveau le plus bas possible ?
Cela me rappelle ce vieil article : https://www.damninteresting.com/on-the-origin-of-circuits/
L’un des petits trésors que j’ai trouvés sur Internet
Un autre commentaire tout proche parlait de la robustesse des conceptions issues du labo, et la partie la plus intéressante de l’article de Damn Interesting était justement le fait que le programme évolué ne pouvait pas être séparé de l’unique FPGA physique utilisé pour l’apprentissage. Comme ce modèle d’apprentissage RFIC utilise un simulateur, je me demande si les caractéristiques du matériel physique sur lequel tourne le simulateur sont suffisamment isolées de l’apprentissage pour que les conceptions se comportent de façon similaire quand on exécute le simulateur sur des matériels différents
La question la plus évidente est de savoir si une conception qui a évolué dans un simulateur a la moindre chance de fonctionner comme prévu sur du matériel physique réel. Mon intuition, pour cette dernière question, serait plutôt non, mais cela reste une recherche intéressante, et je pense souvent que comprendre correctement ce qui s’est réellement passé dans le FPGA pourrait être un préalable pour s’attaquer sérieusement à l’apprentissage par renforcement
Content que tu aies posté cet article ; si tu as d’autres favoris liés à ce domaine, je serais preneur
La grande question, c’est à quel point ces conceptions sont robustes
L’article scientifique montre bien que les mesures sur les dispositifs réels correspondent aux prédictions, mais je n’ai pas trouvé dans le texte de passage qui traite explicitement ce point. Par ailleurs, certains des systèmes présentés incluent des sous-blocs conçus de manière traditionnelle, qui pourraient donc prendre en charge une partie du travail
Peut-être que je vois les choses de travers simplement parce que cela semble menacer mon emploi, ou peut-être qu’ils veulent que nous le pensions
À mon avis, ce qui gagne vraiment, ce sont les idées simples capables de résister aux variations de fabrication et d’environnement ainsi qu’aux limites des modèles. Des choses comme la rétroaction ou la symétrie. Or ce qui est montré ici ressemble plutôt à l’inverse. J’ai déjà fait plusieurs fois de l’optimisation à l’aveugle de paramètres de circuits, et au final, une fois qu’on comprend l’idée simple qu’on avait manquée — « il faut de la symétrie ici » ou « il faut plus de bande passante ici » — tout devient parfaitement logique. Je me demande donc si, en retouchant seulement quelques pixels de cette structure, quelque chose de plus simple n’apparaîtrait pas
Et il faut bien sûr mentionner obligatoirement l’« antenne génétique »
D’après le texte, le rôle de l’IA est de remplacer le simulateur électromagnétique pendant le processus d’optimisation pour estimer le comportement de la structure, ce qui serait plusieurs ordres de grandeur plus rapide que la simulation
Cela paraît plausible, mais pour y croire, j’aimerais voir l’écart entre les estimations de l’IA et les mesures réelles pour des géométries très différentes de celles utilisées pour entraîner l’IA. J’aimerais aussi voir à quel simulateur exactement la vitesse du modèle d’IA est comparée
Pour les champs électromagnétiques et les circuits électroniques, il existe plusieurs approches de simulation qui échangent précision contre vitesse. Je ne suis donc pas convaincu que l’inférence IA prenne nécessairement beaucoup moins de temps qu’une simulation moins précise et plus rapide. Ce type de simulation pourrait aussi être plus exact et plus fiable que les estimations de l’IA
Comme ça a déjà été dit, j’ajouterais, à propos du fait de « comprendre des idées assez simples », que l’un des grands avantages de ce type de conception assistée par ordinateur est, à mon avis, l’« innovization »[1]. Le terme est un peu maladroit, mais l’idée clé est que ces systèmes peuvent mener à une compréhension plus profonde d’un processus donné. Quand on le vit concrètement, c’est assez amusant
[1]: https://dl.acm.org/doi/10.1145/1143997.1144266
Les méthodes décrites dans cet article ne sont pas nouvelles. Des scientifiques concevaient déjà, il y a des décennies, avec des algorithmes génétiques, des antennes que personne ne comprenait mais qui fonctionnaient bien
Ce n’est pas si magique que ça. Comme le dit aussi l’article, la conception RFIC dépasse largement l’ingénierie RF classique : elle relève presque de la magie noire, s’appuie énormément sur les connaissances et l’expérience du concepteur, et bénéficie d’outils de modélisation et de conception qui auraient relevé du supercalculateur il y a quelques décennies
Ce que l’IA peut faire, c’est explorer en largeur tous les résultats possibles, puis choisir celui qui offre les meilleures performances. C’est différent de la façon dont un humain dirait : « cette piste a l’air bonne, creusons-la »