L’IA apprend la « magie noire » de la conception RFIC

(spectrum.ieee.org)

1 points par GN⁺ 4 시간 전 | 1 commentaires | Partager sur WhatsApp

Les RFIC sont à la base des technologies sans fil comme la 5G, le radar automobile et les communications par satellite, mais restent un problème difficile largement manuel, car il faut concilier électromagnétisme, thermique et fiabilité du packaging
Des chercheurs de Princeton ne partent pas de modèles de conception humains : ils combinent apprentissage par renforcement et conception inverse pour explorer dès le départ l’architecture, la topologie des circuits, les paramètres des composants et les interfaces électromagnétiques
Un émulateur fondé sur l’IA prédit en quelques millisecondes les paramètres de diffusion de structures électromagnétiques 2D arbitraires, réduisant fortement les itérations qui prennent des minutes à des heures avec les solveurs électromagnétiques classiques
En 2023, sur un amplificateur de puissance millimétrique 30–100 GHz, l’approche a obtenu ce qui était alors la meilleure combinaison bande passante, puissance de sortie et rendement parmi les amplificateurs de puissance sur silicium ; en 2024, elle a aussi généré des structures d’IC multiports en quelques minutes
L’IA peut aussi produire des circuits qui ne fonctionnent pas, la validation nécessite donc une supervision humaine ; pour aller vers un modèle généraliste, il faut un écosystème ouvert permettant de partager des données de conception RFIC et analogique aujourd’hui couvertes par des NDA

Pourquoi la conception RFIC reste de la « magie noire »

Les RFIC sont les circuits essentiels qui permettent aux appareils d’envoyer et de recevoir des informations sans fil, et les progrès des voitures autonomes, des communications quantiques, de la 6G et des communications par satellite dépendent eux aussi de puces RF plus avancées
La conception de CPU ou de GPU s’est rapprochée d’une science standardisée, mais la conception RF reste fortement marquée par un savoir-faire manuel acquis avec de longues années d’expérience
La conception RFIC traite simultanément plusieurs domaines physiques
- Les équations de Maxwell régissent la manière dont les champs électromagnétiques interagissent avec les composants actifs et passifs
- La thermodynamique détermine la manière dont la chaleur est produite et évacuée pendant le fonctionnement
- La dilatation et la contraction thermiques sont liées à la capacité de la puce et du boîtier à rester stables face aux variations de température
Comme toutes ces contraintes physiques doivent être prises en compte ensemble, l’espace de conception est très vaste, et améliorer un indicateur de performance dégrade souvent un autre indicateur, créant des compromis

Flux traditionnel de conception RFIC et goulets d’étranglement

Pour concevoir un amplificateur de puissance 28 GHz destiné à un combiné 5G millimétrique, il faut d’abord définir l’architecture et la topologie du circuit
L’architecture d’un RFIC définit, comme le plan d’une maison, les composants nécessaires et les chemins de signal
- Dans un amplificateur de puissance, le nombre d’étages d’amplification devient un élément important
- La majeure partie de la surface d’un RFIC est occupée non pas par les transistors, mais par des composants passifs comme les inductances et les lignes de transmission, ainsi que par des structures électromagnétiques
Les signaux 5G fonctionnent à 28 GHz et 39 GHz, les communications par satellite à 26,5–40 GHz et au-delà, et les radars automobiles à 77 GHz ; à ces hautes fréquences, les RFIC gèrent l’énergie du signal au moyen de structures électromagnétiques sophistiquées
Si le chemin du signal n’est pas correctement adapté au composant suivant, un problème d’adaptation d’impédance apparaît : l’énergie ne progresse pas vers l’avant et se réfléchit vers l’arrière
- Les ingénieurs conçoivent de fines structures de transition entre les composants afin de réduire les réflexions
- Ces structures peuvent servir non seulement à transmettre le signal, mais aussi à le diviser, le combiner et le distribuer sur plusieurs chemins
Si les spécifications ne sont pas satisfaites, il faut modifier à nouveau la topologie ou l’architecture et répéter les simulations ; la conception d’une nouvelle puce peut prendre des années et coûter de plusieurs dizaines à plusieurs centaines de millions de dollars

Une approche de conception par IA qui sort des modèles

Les travaux existants utilisaient le machine learning pour optimiser des modèles de circuits, mais dépendaient encore de bibliothèques de conceptions existantes créées par des humains
L’objectif des chercheurs de Princeton est de laisser l’algorithme définir, dès le départ et sans topologie prédéfinie, tous les paramètres de l’architecture, des circuits constitutifs et des structures passives électromagnétiques
Cette méthode part d’un point de départ différent de l’optimisation classique
- L’approche classique ajuste des paramètres comme la taille des transistors ou la forme des composants passifs dans une structure créée par des humains
- La nouvelle approche crée des combinaisons de circuits candidates à partir d’un point de départ presque vide, cartographie les compromis de performance et explore l’espace de conception
Comme AlphaGo Zero, l’approche fait évoluer ses stratégies de conception par exploration et évaluation propres, plutôt qu’en imitant des exemples humains
L’algorithme apprend les circuits, l’électromagnétisme et leur co-conception, avec pour objectif une conception RFIC end-to-end

Combiner apprentissage par renforcement et conception inverse

La première étape est un framework d’apprentissage par renforcement, qui détermine l’architecture système optimale, la topologie des circuits, les paramètres des composants et les caractéristiques des interfaces électromagnétiques
L’agent d’apprentissage par renforcement essaie différentes combinaisons comme un ordinateur qui apprend un jeu, observe la relation entre actions et scores, puis cherche de meilleurs circuits
- L’apprentissage prend de quelques jours à une semaine
- Une fois l’apprentissage terminé, il peut concevoir des circuits très rapidement
La deuxième étape est la conception inverse, qui recherche la structure électromagnétique physique produisant les paramètres de diffusion souhaités
- Les paramètres de diffusion mesurent si un signal progresse vers l’avant ou se réfléchit vers l’arrière lorsqu’il entre dans un composant
- C’est similaire, en génie des structures, à la recherche d’arches ou de structures de support pour créer un espace cible
La conception inverse de RFIC doit faire correspondre simultanément le fonctionnement du circuit et la réponse électromagnétique des interconnexions et composants passifs ; il est donc difficile de la résoudre par une exploration manuelle itérative

Comment l’émulateur IA réduit les itérations de conception électromagnétique

Les chercheurs ont remplacé le simulateur de circuits RF par un émulateur fondé sur l’IA
Ce modèle reçoit en entrée une structure 2D arbitraire et prédit ses paramètres de diffusion sans calculer directement les équations de Maxwell
- Il ramène à quelques millisecondes une tâche qui prenait de quelques minutes à plusieurs heures avec les solveurs électromagnétiques classiques
L’émulateur est construit à partir de réseaux neuronaux convolutifs, efficaces pour le traitement d’images
- L’image de la structure contient des informations spatiales permettant de prédire ses performances électromagnétiques
- Les chercheurs ont entraîné le modèle sur de nombreuses structures aléatoires en pixels, étiquetées avec leurs paramètres de diffusion
En combinant conception inverse par apprentissage par renforcement et émulateur IA, ils ont construit un concepteur IA end-to-end et l’ont appliqué à la conception d’amplificateurs de puissance

Des architectures RF différentes de celles des humains

La preuve de concept publiée en 2023 ciblait des amplificateurs de puissance en bande millimétrique de 30 à 100 GHz
- Cette plage couvre la plupart des fréquences pertinentes pour la 5G et le radar
- La conception finale présentait alors la meilleure combinaison de wide bandwidth, output power et efficiency parmi les amplificateurs de puissance sur silicium, tout en conservant un record efficiency
Les chemins électromagnétiques générés ressemblaient à des motifs arbitraires ou à des QR codes, contrairement aux structures régulières et symétriques que les humains envisagent généralement
Ce résultat montre que rien ne garantit que les modèles utilisés historiquement soient proches de l’optimum pour les objectifs de conception modernes
Les chercheurs ont ensuite étendu le modèle à des structures comportant de nombreux ports d’entrée et de sortie
- 2 ports impliquent 4 paramètres de diffusion, 4 ports en impliquent 16, ce qui fait croître rapidement la complexité
- Dans une étude de 2024 sur les multiport integrated circuits, ils ont montré que l’algorithme d’IA pouvait aussi gérer des structures multiports
- Auparavant, la simulation électromagnétique multiport nécessitait des jours, voire des semaines ; ce modèle fait évoluer de nouvelles structures en quelques minutes
En combinant framework d’apprentissage par renforcement et conception inverse, ils ont démontré un flux allant des spécifications jusqu’au fabrication-ready layout, appliqué à des amplificateurs à faible bruit, au subterahertz et à des power amplifiers broadband

Une conception IA interprétable

Les tests et le débogage de RFIC peuvent prendre autant de temps que la conception, voire être plus difficiles ; les ingénieurs préfèrent donc des structures interprétables qu’ils peuvent comprendre et corriger en cas de problème
Les chercheurs ont appliqué à la génération de structures RFIC les diffusion models utilisés dans l’IA de génération d’images
Au lieu de prompts textuels, ils utilisent en entrée les paramètres de diffusion et génèrent en sortie la structure électromagnétique du RFIC
Ils ont inclus dans l’entrée un cadran de fréquence spatiale permettant au concepteur de contrôler la forme de la structure résultante
- Faible fréquence spatiale : forme classique et interprétable
- Fréquence spatiale intermédiaire : structure de type labyrinthe
- Fréquence spatiale élevée : structure pixellisée ou proche d’une forme arbitraire
L’ensemble du processus, du prompt à la sortie, prend environ 6 minutes et peut générer une structure correspondante pour des paramètres de diffusion physiquement réalisables sous les équations de Maxwell

Limites restantes et défi des données

Les approches de conception fondées sur l’IA ont suscité l’intérêt de la communauté RF et commencent à renverser le flux de conception bottom-up traditionnel
Des questions restent ouvertes
- Jusqu’où la méthode peut-elle se généraliser ?
- Peut-elle produire régulièrement de hautes performances ?
- Peut-elle optimiser globalement tous les compromis possibles ?
- Peut-elle inventer, au-delà des RFIC, d’autres circuits jamais créés par des humains ?
L’IA peut avoir des hallucinations en générant de mauvais circuits qui ne fonctionnent pas ; la validation nécessite donc toujours une supervision humaine
Pour créer un foundational model généraliste, il faut de grands volumes de données permettant d’apprendre les lois qui gouvernent l’électromagnétisme et le fonctionnement des circuits
- ImageNet, avec 14 millions d’images diverses étiquetées par des humains, est un exemple qui a permis la généralisation des modèles de reconnaissance d’images
- La conception RFIC et analogique a elle aussi besoin de données d’une ampleur et d’une diversité similaires
Ces données existent en grand nombre dans les simulations d’entreprises et de laboratoires du monde entier, mais la plupart sont enfermées derrière des NDA
Natcast opérait le programme R&D du U.S. CHIPS and Science Act et aurait pu renforcer l’innovation et les infrastructures partagées pour les technologies sans fil, de détection et de défense de nouvelle génération, mais l’organisation et le programme lié au machine learning et aux RFIC ont été arrêtés
Si le domaine des RFIC élargit la collaboration entre chercheurs en IA et concepteurs de puces et crée un écosystème ouvert, il pourra mieux exploiter le potentiel de la conception d’IC fondée sur l’IA

1 commentaires

GN⁺ 4 시간 전

Avis sur Hacker News

Ça me rappelle les anciennes recherches par algorithmes génétiques. Une approche par conjecture et vérification peut être assez puissante, surtout si l’on peut y ajouter le guidage d’un agent en cours de route
https://en.wikipedia.org/wiki/Evolved_antenna
- J’allais dire quelque chose de similaire. Je me souviens d’une anecdote où l’on avait créé par algorithme génétique un oscillateur avec un nombre minimal de composants ; au final, il aurait réussi avec un simple fil, à la surprise générale. Autrement dit, c’était en fait une antenne qui captait le bruit RF environnant
- Il y a aussi ceci : https://en.wikipedia.org/wiki/Evolvable_hardware
  Pour commencer : https://sci-hub.ru/storage/moscow/4324/11d145b2c2c3ab320f70b...
Je me demande si l’attente courante selon laquelle une vraie théorie doit être quelque part belle et élégante survivra au siècle qui vient. Et si les phénomènes naturels réels étaient en fait mieux décrits par un amas d’équations terriblement brouillon, que seules les machines peuvent manipuler et raisonner ? Ce serait assez triste
- L’expression « attente courante » me semble un peu excessive. La plupart des gens comprennent les théories scientifiques comme des approximations. Même F=ma n’est valable que dans le cadre de la mécanique newtonienne, et chaque terme est assorti d’innombrables réserves ; les mesures réelles ne sont donc toujours que des approximations
  La blague des physiciens qui supposent une « vache parfaitement sphérique » va dans ce sens, et le cœur de l’essai sur « l’efficacité déraisonnable des mathématiques » en est en fait assez proche. L’idée est qu’il est déraisonnablement surprenant que des approximations mathématiques décrivent si bien le monde
- J’y pense souvent en regardant la médecine et le corps humain. On aimerait croire que le corps est une machine miraculeusement bien huilée, mais en réalité il ressemble souvent à un sac en désordre qui tient à peine ensemble
- Ces temps-ci, j’y pense souvent aussi. Surtout quand on voit apparaître beaucoup de preuves difficiles à comprendre mais vérifiables par machine
  Le rasoir d’Occam est une heuristique utile, mais il nous biaise aussi vers les explications les plus simples
- Au contraire, ce serait vraiment magnifique. Au niveau le plus bas, on sait déjà que tout est un nuage de probabilités. Il y a de la beauté et du réconfort dans l’idée que rien ne peut jamais être établi définitivement
- « Attente courante » me semble passer à côté du point essentiel. Il ne s’agit pas de dire qu’une théorie fondamentale doit être simple ou élégante, mais plutôt que si l’on doit choisir entre une théorie plus complexe et une théorie plus simple, c’est généralement la théorie la plus simple qui est le choix le plus exact. Les équations de la physique quantique sont d’ailleurs assez laides
L’un des excellents usages de la conception par IA, c’est la pollution des brevets. On peut générer massivement des variantes de conceptions avec l’IA et les publier sur un site web ; plus tard, si un brevet apparaît, on peut utiliser les recoupements pour l’invalider ou au moins en réduire la portée. Car la généralisation d’un brevet est limitée par l’état de la technique antérieur
- Ça me rappelle la réponse très performative de l’avocat Damien Riehl au moment du jugement pour contrefaçon Sam Smith en 2019/2020. Avec le programmeur Noah Rubin, il a affirmé avoir généré algorithmiquement, au format MIDI, toutes les mélodies possibles dans un certain espace combinatoire, puis les avoir publiées sous licence CC-0 [0]
  Il a ensuite expliqué son raisonnement lors d’un événement TEDx local, ce qui a attiré une certaine attention [1], et je me souviens que les commentateurs juridiques étaient plutôt sceptiques, en disant que les juges distinguent couramment des différences bien plus fines que cela. Mais c’était quand même une tentative amusante
  [0] https://allthemusic.info/
  [1] https://m.youtube.com/watch?v=sJtm0MoOgiU and
  https://www.the-independent.com/tech/music-copyright-algorit...
C’est un peu frustrant. L’IA peut faire beaucoup de choses, mais en mélangeant sans cesse les LLM avec Monte-Carlo, les algorithmes génétiques, les systèmes experts et autres formes de sorcellerie statistique relevant du machine learning traditionnel, on amalgame de manière trop agressive des activités de machine learning déjà établies et moralement neutres avec les inquiétudes autour des LLM et de Stable Diffusion
Et je me dis que c’est peut-être intentionnel
- Le problème, c’est que les gens disent ce que l’IA peut faire en laissant entendre que les LLM peuvent le faire. Du coup, on a l’impression qu’un LLM pur peut faire à peu près n’importe quoi. À l’inverse, on dit aussi que l’IA ne pourra jamais faire X parce que les LLM ne sont pas nativement bons pour telle tâche. Le terme IA est devenu trop vague pour être vraiment utile
- J’aimerais agiter une baguette magique et faire disparaître le mot IA lui-même. Il n’a pas de sens réel. Il peut désigner n’importe quoi, des personnages adverses dans Mario Kart à Stable Diffusion
- « IA » est un terme maudit par ses connotations SF séduisantes. C’est pour cela qu’il est puissant comme terme marketing. Beaucoup de gens connaissent l’IA de science-fiction, et l’idée selon laquelle « tel média a prédit telle technologie » est assez répandue, avec des X comme Star Trek, Le Guide du voyageur galactique ou Arthur C. Clarke, et des Y comme Internet, les téléphones portables ou la VR
  Quand on veut dire qu’il y a eu une grande avancée dans quelque chose, se raccrocher à cette compréhension vulgarisée selon laquelle la SF prédit les réussites humaines demande peu d’efforts et produit beaucoup d’effet. Si l’objectif numéro un est d’enthousiasmer les gens, ce n’est pas de communiquer avec exactitude
- Je m’entraîne donc à appeler le machine learning traditionnel ML, et les grands modèles de langage LLM. J’essaie de ne plus utiliser le mot IA autant que possible. Il est trop ambigu. Même quand je parle de l’IA dans les jeux, j’essaie d’utiliser l’abréviation de l’algorithme qu’elle semble employer. Je dis souvent organigramme, même si je ne suis pas certain que l’intérieur soit réellement un organigramme
- Tout comme, pendant les hivers de l’IA, les branches du machine learning qui réussissaient le mieux prenaient leurs distances avec ce terme, maintenant que nous sommes dans un été de l’IA, on verra sans doute ces domaines se le réapproprier, et c’est peut-être déjà le cas
L’expression « les humains n’auraient même pas pu l’imaginer » me paraît exagérée. Cela dit, il semble tout à fait possible qu’un algorithme d’apprentissage automatique puisse, par recherche exhaustive, aboutir à une conception de puce que personne n’a encore essayée, et que certaines d’entre elles nous soient utiles. C’est une tâche assez raisonnable à confier à un ordinateur
- C’est du baratin marketing. D’abord, c’est comme prouver une négation : on ne peut pas prouver que les humains n’auraient pas pu l’imaginer. Ensuite, les humains ont déjà imaginé pas mal de choses bizarres
- On dirait un layer cake d’apprentissage automatique saupoudré de miettes de recherche exhaustive
Une chose qu’on peut retenir de l’article, c’est qu’il a fallu abandonner les blocs de base éprouvés de la conception de puces pour obtenir ces avancées. Je me demande si la même chose vaut pour le codage ordinaire. Les innovations étonnantes du codage par IA sont-elles en réalité freinées par Rust et Python ? Faut-il laisser les outils d’IA coder tout simplement au niveau le plus bas possible ?
- Question intéressante, mais cela semble avoir des implications assez inquiétantes pour la portabilité
Cela me rappelle ce vieil article : https://www.damninteresting.com/on-the-origin-of-circuits/
L’un des petits trésors que j’ai trouvés sur Internet
- J’allais aussi le poster. Il m’avait vraiment bluffé à la première lecture, donc ça fait plaisir de voir que d’autres l’apprécient aussi
  Un autre commentaire tout proche parlait de la robustesse des conceptions issues du labo, et la partie la plus intéressante de l’article de Damn Interesting était justement le fait que le programme évolué ne pouvait pas être séparé de l’unique FPGA physique utilisé pour l’apprentissage. Comme ce modèle d’apprentissage RFIC utilise un simulateur, je me demande si les caractéristiques du matériel physique sur lequel tourne le simulateur sont suffisamment isolées de l’apprentissage pour que les conceptions se comportent de façon similaire quand on exécute le simulateur sur des matériels différents
  La question la plus évidente est de savoir si une conception qui a évolué dans un simulateur a la moindre chance de fonctionner comme prévu sur du matériel physique réel. Mon intuition, pour cette dernière question, serait plutôt non, mais cela reste une recherche intéressante, et je pense souvent que comprendre correctement ce qui s’est réellement passé dans le FPGA pourrait être un préalable pour s’attaquer sérieusement à l’apprentissage par renforcement
  Content que tu aies posté cet article ; si tu as d’autres favoris liés à ce domaine, je serais preneur
- C’est aussi un exemple d’espèce devenue tellement spécialisée et optimisée qu’elle n’est plus capable de s’adapter. Et c’est aussi un exemple de POSIWID
La grande question, c’est à quel point ces conceptions sont robustes
L’article scientifique montre bien que les mesures sur les dispositifs réels correspondent aux prédictions, mais je n’ai pas trouvé dans le texte de passage qui traite explicitement ce point. Par ailleurs, certains des systèmes présentés incluent des sous-blocs conçus de manière traditionnelle, qui pourraient donc prendre en charge une partie du travail
Peut-être que je vois les choses de travers simplement parce que cela semble menacer mon emploi, ou peut-être qu’ils veulent que nous le pensions
À mon avis, ce qui gagne vraiment, ce sont les idées simples capables de résister aux variations de fabrication et d’environnement ainsi qu’aux limites des modèles. Des choses comme la rétroaction ou la symétrie. Or ce qui est montré ici ressemble plutôt à l’inverse. J’ai déjà fait plusieurs fois de l’optimisation à l’aveugle de paramètres de circuits, et au final, une fois qu’on comprend l’idée simple qu’on avait manquée — « il faut de la symétrie ici » ou « il faut plus de bande passante ici » — tout devient parfaitement logique. Je me demande donc si, en retouchant seulement quelques pixels de cette structure, quelque chose de plus simple n’apparaîtrait pas
Et il faut bien sûr mentionner obligatoirement l’« antenne génétique »
- C’est précisément ce qui me gêne dans cet article et dans quelques articles similaires par le passé. Ils ne contiennent pas de preuve que l’IA soit utile dans la conception
  D’après le texte, le rôle de l’IA est de remplacer le simulateur électromagnétique pendant le processus d’optimisation pour estimer le comportement de la structure, ce qui serait plusieurs ordres de grandeur plus rapide que la simulation
  Cela paraît plausible, mais pour y croire, j’aimerais voir l’écart entre les estimations de l’IA et les mesures réelles pour des géométries très différentes de celles utilisées pour entraîner l’IA. J’aimerais aussi voir à quel simulateur exactement la vitesse du modèle d’IA est comparée
  Pour les champs électromagnétiques et les circuits électroniques, il existe plusieurs approches de simulation qui échangent précision contre vitesse. Je ne suis donc pas convaincu que l’inférence IA prenne nécessairement beaucoup moins de temps qu’une simulation moins précise et plus rapide. Ce type de simulation pourrait aussi être plus exact et plus fiable que les estimations de l’IA
- Je venais aussi mentionner l’antenne génétique
  Comme ça a déjà été dit, j’ajouterais, à propos du fait de « comprendre des idées assez simples », que l’un des grands avantages de ce type de conception assistée par ordinateur est, à mon avis, l’« innovization »[1]. Le terme est un peu maladroit, mais l’idée clé est que ces systèmes peuvent mener à une compréhension plus profonde d’un processus donné. Quand on le vit concrètement, c’est assez amusant
  [1]: https://dl.acm.org/doi/10.1145/1143997.1144266
- C’est simplement un article poubelle survendu
Les méthodes décrites dans cet article ne sont pas nouvelles. Des scientifiques concevaient déjà, il y a des décennies, avec des algorithmes génétiques, des antennes que personne ne comprenait mais qui fonctionnaient bien
Ce n’est pas si magique que ça. Comme le dit aussi l’article, la conception RFIC dépasse largement l’ingénierie RF classique : elle relève presque de la magie noire, s’appuie énormément sur les connaissances et l’expérience du concepteur, et bénéficie d’outils de modélisation et de conception qui auraient relevé du supercalculateur il y a quelques décennies
Ce que l’IA peut faire, c’est explorer en largeur tous les résultats possibles, puis choisir celui qui offre les meilleures performances. C’est différent de la façon dont un humain dirait : « cette piste a l’air bonne, creusons-la »
- Faut-il forcément que ce soit magique pour que ce soit intéressant ou utile ?

L’IA apprend la « magie noire » de la conception RFIC

Pourquoi la conception RFIC reste de la « magie noire »

Flux traditionnel de conception RFIC et goulets d’étranglement

Une approche de conception par IA qui sort des modèles

Combiner apprentissage par renforcement et conception inverse

Comment l’émulateur IA réduit les itérations de conception électromagnétique

Des architectures RF différentes de celles des humains

Une conception IA interprétable

Limites restantes et défi des données

À lire aussi

1 commentaires

Avis sur Hacker News