Passer aux TPU : retour sur 10 ans d’histoire des puces dédiées à l’IA

xguru · 2024-08-06T10:46:01+09:00

Il y a environ 10 ans, les chercheurs de Google ont anticipé que la demande en calcul pour l’IA dépasserait les capacités de l’infrastructure de l’époque Constatant qu’aucune alternative sur le marché ne permettrait de répondre à cette demande, ils ont commencé à développer un nouveau type de puce, le TPU (Tensor Processing Unit) Une puce à objectif unique Alors que le CPU joue le rôle de « cerveau » polyvalent de l’ordinateur, le TPU est une puce à usage spécifique optimisée pour l’IA Le TPU est un ASIC (application-specific integrated circuit) spécialisé dans les opérations mathématiques basées sur des matrices et des vecteurs, nécessaires à la création et à l’exécution des modèles d’IA Déployé en interne en 2015, le TPU v1 a immédiatement rencontré un grand succès chez Google, et au cours des 10 années suivantes, les TPU ont continué à progresser en matière de performances et d’efficacité Suivre le rythme de l’innovation en IA L’évolution des TPU est étroitement liée aux innovations en machine learning et en IA Le TPU v1 était centré sur l’inférence, mais Google a rapidement développé le supercalculateur d’entraînement TPU v2 afin d’améliorer l’efficacité de l’entraînement des modèles Par la suite, les TPU ont été lancés à un rythme plus soutenu, avec des bonds majeurs en performances, en efficacité et en capacité de traitement Dans les générations les plus récentes, la vitesse de traitement des données est si élevée qu’il faut même prêter attention au câblage des connexions entre les puces Partager l’innovation À ses débuts, Google n’était pas le seul à chercher une meilleure façon de développer et d’exécuter des modèles d’IA Début 2018, Google Cloud a lancé la première génération de Cloud TPU afin d’aider ses clients à accélérer leurs propres charges de travail d’entraînement et d’inférence Aujourd’hui, des équipes IA bien connues comme Anthropic, Midjourney et Salesforce utilisent intensivement Cloud TPU Et toute cette puissance de calcul n’en est encore qu’à ses débuts À l’avenir, l’entreprise prévoit de faire évoluer la conception des datacenters pour mieux l’adapter aux exigences des TPU Au-delà de la puce unique ou du pod TPU unique, Google construit un réseau mondial de datacenters remplis de TPU L’avenir sera celui d’une personnalisation full stack de bout en bout, du silicium au béton (The future is full stack customization all the way, from silicon to concrete)

(cloud.google.com)

8 points par xguru 2024-08-06 | 2 commentaires | Partager sur WhatsApp

Il y a environ 10 ans, les chercheurs de Google ont anticipé que la demande en calcul pour l’IA dépasserait les capacités de l’infrastructure de l’époque
Constatant qu’aucune alternative sur le marché ne permettrait de répondre à cette demande, ils ont commencé à développer un nouveau type de puce, le TPU (Tensor Processing Unit)

Une puce à objectif unique

Alors que le CPU joue le rôle de « cerveau » polyvalent de l’ordinateur, le TPU est une puce à usage spécifique optimisée pour l’IA
Le TPU est un ASIC (application-specific integrated circuit) spécialisé dans les opérations mathématiques basées sur des matrices et des vecteurs, nécessaires à la création et à l’exécution des modèles d’IA
Déployé en interne en 2015, le TPU v1 a immédiatement rencontré un grand succès chez Google, et au cours des 10 années suivantes, les TPU ont continué à progresser en matière de performances et d’efficacité

Suivre le rythme de l’innovation en IA

L’évolution des TPU est étroitement liée aux innovations en machine learning et en IA
Le TPU v1 était centré sur l’inférence, mais Google a rapidement développé le supercalculateur d’entraînement TPU v2 afin d’améliorer l’efficacité de l’entraînement des modèles
Par la suite, les TPU ont été lancés à un rythme plus soutenu, avec des bonds majeurs en performances, en efficacité et en capacité de traitement
Dans les générations les plus récentes, la vitesse de traitement des données est si élevée qu’il faut même prêter attention au câblage des connexions entre les puces

Partager l’innovation

À ses débuts, Google n’était pas le seul à chercher une meilleure façon de développer et d’exécuter des modèles d’IA
Début 2018, Google Cloud a lancé la première génération de Cloud TPU afin d’aider ses clients à accélérer leurs propres charges de travail d’entraînement et d’inférence
Aujourd’hui, des équipes IA bien connues comme Anthropic, Midjourney et Salesforce utilisent intensivement Cloud TPU
Et toute cette puissance de calcul n’en est encore qu’à ses débuts
À l’avenir, l’entreprise prévoit de faire évoluer la conception des datacenters pour mieux l’adapter aux exigences des TPU
Au-delà de la puce unique ou du pod TPU unique, Google construit un réseau mondial de datacenters remplis de TPU
L’avenir sera celui d’une personnalisation full stack de bout en bout, du silicium au béton (The future is full stack customization all the way, from silicon to concrete)

2 commentaires

ing03201 2024-08-06

Les TPU avaient vraiment une longueur d’avance
Google l’a bien montré avec le traitement photo à caméra unique du Pixel 2 XL, et ils connaissent aujourd’hui leur âge d’or à l’ère des LLM
Alors, une petite mise à jour de la carte Coral Micro Dev, s’il vous plaît.... snif snif snif snif

ganadist 2024-08-06

Le processeur d’image inclus dans les premiers modèles de Pixel (appelé Visual Core) est basé sur la plateforme Monette Hill d’Intel.

Analyse approfondie : https://forums.anandtech.com/threads/…
Source du noyau Linux de Visual Core : pour un sujet qui ne fait que du traitement d’image, il embarque carrément un noyau Linux complet. https://android.googlesource.com/kernel/arm64/…