Expansion de la capacité IA de Tesla - H100, Dojo D1, D2, HW 4.0, X.AI et fournisseurs de services cloud

xguru · 2023-07-04T10:47:01+09:00

Tesla veut devenir l’une des meilleures entreprises d’IA au monde Bien sûr, Tesla n’a pas encore livré la meilleure conduite autonome, et l’entreprise est peu visible dans l’univers de l’IA générative, mais… Tesla dispose actuellement en interne d’une petite infrastructure IA d’environ 4 000 V100 et 16 000 A100 Microsoft et Meta possèdent plus de 100 000 GPU et cherchent à doubler ce nombre La faiblesse de l’infrastructure IA de Tesla s’explique en partie par le retard de sa puce d’entraînement D1 développée en interne Mais la situation évolue désormais rapidement Tesla augmente sa capacité IA de plus de 10x en seulement 1,5 an Une partie sert à ses propres usages, mais une autre est destinée à X.AI Tesla conçoit ses propres puces IA depuis 2016 pour l’automobile, et depuis 2018 pour les data centers L’entreprise n’avait pas encore vraiment lancé la production jusqu’ici, mais accélère désormais en 2023 Cette architecture convient au cas d’usage spécifique de Tesla, mais n’est pas utile pour les LLM (elle est centrée sur les réseaux d’images) Tesla HW 4.0, puce FSD de 2e génération La puce qui effectue l’inférence IA à l’intérieur des véhicules Tesla est appelée puce FSD Tesla estime qu’une puissance énorme n’est pas nécessaire dans la voiture pour parvenir à une conduite entièrement autonome, donc les performances de la puce embarquée restent très limitées En outre, comme Tesla vend en volume, ses contraintes de coût sont bien plus strictes que celles de Waymo/Cruise Waymo/Cruise ont utilisé, pendant le développement et les premiers tests, des GPU pleine taille coûtant plus de 10 fois plus cher, et développent des SoC plus rapides et plus coûteux Les puces de 2e génération équipent les véhicules vendus depuis février 2023 La 1re génération reposait sur le procédé 14 nm de Samsung, avec 12 Arm Cortex-A72 (2,2 GHz) organisés en 3 clusters quad-core La 2e génération passe à 20 Arm Cortex-A72 organisés en 5 clusters quad-core L’élément le plus important de la 2e génération est constitué de trois cœurs NPU Les 3 cœurs utilisent chacun 32 MiB de SRAM pour stocker les poids du modèle et les activations À chaque cycle, 256 octets de données d’activation et 128 octets de données de poids sont lus depuis la SRAM vers le MAC (Multiply Accumulate Unit) Le MAC est conçu en grille ; chaque cœur NPU dispose d’une grille 96x96, soit 9 216 MAC au total, permettant 18 432 opérations par cycle d’horloge Avec un NPU cadencé à 2,2 GHz, la puissance de calcul atteint 121,641 TOPS (trillion operations per second) La puce FSD de 2e génération embarque 256 Go de stockage NVMe et 16 Go de Micron DDR6 (14 Gbps) sur un bus mémoire 128 bits offrant 224 Go/s de bande passante La bande passante est 3,3x plus élevée que sur la 1re génération Le HW 4.0 intègre 2 puces FSD L’amélioration des performances de la carte HW4 augmente aussi la consommation électrique (le double du HW3) Malgré les gains de performance du HW4, Tesla souhaite continuer à prendre en charge le FSD sur HW3, afin que les acheteurs actuels du FSD sur HW3 n’aient pas besoin d’un retrofit Le système d’infodivertissement utilise un GPU/APU AMD. Il se trouve sur la même carte que la puce FSD (auparavant, il était sur une carte fille séparée) La plateforme HW4 prend en charge 12 caméras. L’une sert à la redondance, et 11 sont réellement utilisées Auparavant, le hub de caméra avant utilisait 3 caméras basse résolution de 1,2 mégapixel ; la nouvelle plateforme utilise 2 caméras de 5 mégapixels Tesla n’utilise actuellement pas de capteurs autres que le LIDAR et les caméras L’entreprise utilisait auparavant un radar, mais il a été retiré à partir d’une génération intermédiaire Cela a permis de réduire fortement les coûts de fabrication des véhicules, et Tesla pense qu’un véhicule autonome basé uniquement sur des caméras est possible, tout en poursuivant les optimisations Cela dit, Tesla a déjà indiqué que si un radar viable existait, il serait intégré au système de caméras La plateforme HW4 devrait embarquer un radar maison appelé Phoenix L’objectif de Phoenix est de combiner le système radar et le système de caméras pour exploiter davantage de données et rendre les véhicules plus sûrs Le radar Phoenix utilise le spectre 76-77 GHz Il s’agit d’un système radar automobile non pulsé prenant en charge trois modes de détection Différenciation des modèles IA de Tesla Tesla vise à produire des modèles d’IA fondamentaux pour faire fonctionner des robots et des voitures autonomes Les deux doivent percevoir leur environnement et s’y déplacer, donc le même type de modèle IA peut s’appliquer aux deux L’inférence de ce modèle exige une faible consommation et une faible latence ; à cause des contraintes matérielles, cela limite fortement la taille maximale des modèles que Tesla peut déployer Parmi toutes les entreprises, Tesla dispose du plus grand jeu de données exploitable pour le deep learning Chaque voiture sur la route capture des données à l’aide de capteurs et d’images, et multiplié par le nombre de véhicules électriques Tesla en circulation, cela constitue un jeu de données immense Tesla appelle cette collecte de données « Fleet Scale Auto Labeling » Chaque véhicule électrique Tesla extrait des clips de logs de 45 à 60 secondes de données capteurs denses, comprenant la vidéo, les données d’IMU interne (unité de mesure inertielle), le GPS, le kilométrage, etc., puis les envoie aux serveurs d’entraînement de Tesla Tesla n’utilise qu’une infime partie des données qu’elle collecte Tesla est connue pour surentraîner ses modèles afin d’atteindre la meilleure précision possible dans une taille de modèle donnée, en raison des contraintes pesant sur l’inférence

(semianalysis.com)

9 points par xguru 2023-07-04 | 3 commentaires | Partager sur WhatsApp

Tesla veut devenir l’une des meilleures entreprises d’IA au monde
Bien sûr, Tesla n’a pas encore livré la meilleure conduite autonome, et l’entreprise est peu visible dans l’univers de l’IA générative, mais…
Tesla dispose actuellement en interne d’une petite infrastructure IA d’environ 4 000 V100 et 16 000 A100
- Microsoft et Meta possèdent plus de 100 000 GPU et cherchent à doubler ce nombre
La faiblesse de l’infrastructure IA de Tesla s’explique en partie par le retard de sa puce d’entraînement D1 développée en interne
Mais la situation évolue désormais rapidement
Tesla augmente sa capacité IA de plus de 10x en seulement 1,5 an
Une partie sert à ses propres usages, mais une autre est destinée à X.AI
Tesla conçoit ses propres puces IA depuis 2016 pour l’automobile, et depuis 2018 pour les data centers
L’entreprise n’avait pas encore vraiment lancé la production jusqu’ici, mais accélère désormais en 2023
Cette architecture convient au cas d’usage spécifique de Tesla, mais n’est pas utile pour les LLM (elle est centrée sur les réseaux d’images)

Tesla HW 4.0, puce FSD de 2e génération

La puce qui effectue l’inférence IA à l’intérieur des véhicules Tesla est appelée puce FSD
Tesla estime qu’une puissance énorme n’est pas nécessaire dans la voiture pour parvenir à une conduite entièrement autonome, donc les performances de la puce embarquée restent très limitées
En outre, comme Tesla vend en volume, ses contraintes de coût sont bien plus strictes que celles de Waymo/Cruise
Waymo/Cruise ont utilisé, pendant le développement et les premiers tests, des GPU pleine taille coûtant plus de 10 fois plus cher, et développent des SoC plus rapides et plus coûteux
Les puces de 2e génération équipent les véhicules vendus depuis février 2023
La 1re génération reposait sur le procédé 14 nm de Samsung, avec 12 Arm Cortex-A72 (2,2 GHz) organisés en 3 clusters quad-core
La 2e génération passe à 20 Arm Cortex-A72 organisés en 5 clusters quad-core
L’élément le plus important de la 2e génération est constitué de trois cœurs NPU
- Les 3 cœurs utilisent chacun 32 MiB de SRAM pour stocker les poids du modèle et les activations
- À chaque cycle, 256 octets de données d’activation et 128 octets de données de poids sont lus depuis la SRAM vers le MAC (Multiply Accumulate Unit)
- Le MAC est conçu en grille ; chaque cœur NPU dispose d’une grille 96x96, soit 9 216 MAC au total, permettant 18 432 opérations par cycle d’horloge
- Avec un NPU cadencé à 2,2 GHz, la puissance de calcul atteint 121,641 TOPS (trillion operations per second)
La puce FSD de 2e génération embarque 256 Go de stockage NVMe et 16 Go de Micron DDR6 (14 Gbps) sur un bus mémoire 128 bits offrant 224 Go/s de bande passante
- La bande passante est 3,3x plus élevée que sur la 1re génération
Le HW 4.0 intègre 2 puces FSD
L’amélioration des performances de la carte HW4 augmente aussi la consommation électrique (le double du HW3)
Malgré les gains de performance du HW4, Tesla souhaite continuer à prendre en charge le FSD sur HW3, afin que les acheteurs actuels du FSD sur HW3 n’aient pas besoin d’un retrofit
Le système d’infodivertissement utilise un GPU/APU AMD. Il se trouve sur la même carte que la puce FSD (auparavant, il était sur une carte fille séparée)
La plateforme HW4 prend en charge 12 caméras. L’une sert à la redondance, et 11 sont réellement utilisées
- Auparavant, le hub de caméra avant utilisait 3 caméras basse résolution de 1,2 mégapixel ; la nouvelle plateforme utilise 2 caméras de 5 mégapixels
Tesla n’utilise actuellement pas de capteurs autres que le LIDAR et les caméras
L’entreprise utilisait auparavant un radar, mais il a été retiré à partir d’une génération intermédiaire
- Cela a permis de réduire fortement les coûts de fabrication des véhicules, et Tesla pense qu’un véhicule autonome basé uniquement sur des caméras est possible, tout en poursuivant les optimisations
- Cela dit, Tesla a déjà indiqué que si un radar viable existait, il serait intégré au système de caméras
La plateforme HW4 devrait embarquer un radar maison appelé Phoenix
- L’objectif de Phoenix est de combiner le système radar et le système de caméras pour exploiter davantage de données et rendre les véhicules plus sûrs
- Le radar Phoenix utilise le spectre 76-77 GHz
- Il s’agit d’un système radar automobile non pulsé prenant en charge trois modes de détection

Différenciation des modèles IA de Tesla

Tesla vise à produire des modèles d’IA fondamentaux pour faire fonctionner des robots et des voitures autonomes
Les deux doivent percevoir leur environnement et s’y déplacer, donc le même type de modèle IA peut s’appliquer aux deux
L’inférence de ce modèle exige une faible consommation et une faible latence ; à cause des contraintes matérielles, cela limite fortement la taille maximale des modèles que Tesla peut déployer
Parmi toutes les entreprises, Tesla dispose du plus grand jeu de données exploitable pour le deep learning
Chaque voiture sur la route capture des données à l’aide de capteurs et d’images, et multiplié par le nombre de véhicules électriques Tesla en circulation, cela constitue un jeu de données immense
Tesla appelle cette collecte de données « Fleet Scale Auto Labeling »
Chaque véhicule électrique Tesla extrait des clips de logs de 45 à 60 secondes de données capteurs denses, comprenant la vidéo, les données d’IMU interne (unité de mesure inertielle), le GPS, le kilométrage, etc., puis les envoie aux serveurs d’entraînement de Tesla
Tesla n’utilise qu’une infime partie des données qu’elle collecte
- Tesla est connue pour surentraîner ses modèles afin d’atteindre la meilleure précision possible dans une taille de modèle donnée, en raison des contraintes pesant sur l’inférence

3 commentaires

wkwnqlw 2023-07-05

Tesla propose déjà son logiciel de conduite autonome en version bêta depuis 2 ans. À partir de la prochaine version, le service devrait être officiellement lancé.
La première version était très insuffisante, mais de plus en plus de personnes affirment que le logiciel actuellement proposé dépasse le niveau d’un conducteur moyen. À l’heure actuelle, le logiciel de conduite autonome de Tesla (FSD) présente un taux d’accident environ trois fois inférieur à celui des humains.

bbongcol 2023-07-04

Il y a une coquille dans « 1832 opérations possibles par cycle d’horloge ». Dans l’original, il est indiqué 18 432 opérations.

xguru 2023-07-04

L’article est payant, donc on ne voit pas la suite, mais même le début est suffisamment intéressant pour que je me permette de le partager ici.

Expansion de la capacité IA de Tesla - H100, Dojo D1, D2, HW 4.0, X.AI et fournisseurs de services cloud

Tesla HW 4.0, puce FSD de 2e génération

Différenciation des modèles IA de Tesla

À lire aussi

3 commentaires