- Il y a environ 10 ans, les chercheurs de Google ont anticipé que la demande en calcul pour l’IA dépasserait les capacités de l’infrastructure de l’époque
- Constatant qu’aucune alternative sur le marché ne permettrait de répondre à cette demande, ils ont commencé à développer un nouveau type de puce, le TPU (Tensor Processing Unit)
Une puce à objectif unique
- Alors que le CPU joue le rôle de « cerveau » polyvalent de l’ordinateur, le TPU est une puce à usage spécifique optimisée pour l’IA
- Le TPU est un ASIC (
application-specific integrated circuit) spécialisé dans les opérations mathématiques basées sur des matrices et des vecteurs, nécessaires à la création et à l’exécution des modèles d’IA
- Déployé en interne en 2015, le TPU v1 a immédiatement rencontré un grand succès chez Google, et au cours des 10 années suivantes, les TPU ont continué à progresser en matière de performances et d’efficacité
Suivre le rythme de l’innovation en IA
- L’évolution des TPU est étroitement liée aux innovations en machine learning et en IA
- Le TPU v1 était centré sur l’inférence, mais Google a rapidement développé le supercalculateur d’entraînement TPU v2 afin d’améliorer l’efficacité de l’entraînement des modèles
- Par la suite, les TPU ont été lancés à un rythme plus soutenu, avec des bonds majeurs en performances, en efficacité et en capacité de traitement
- Dans les générations les plus récentes, la vitesse de traitement des données est si élevée qu’il faut même prêter attention au câblage des connexions entre les puces
Partager l’innovation
- À ses débuts, Google n’était pas le seul à chercher une meilleure façon de développer et d’exécuter des modèles d’IA
- Début 2018, Google Cloud a lancé la première génération de Cloud TPU afin d’aider ses clients à accélérer leurs propres charges de travail d’entraînement et d’inférence
- Aujourd’hui, des équipes IA bien connues comme Anthropic, Midjourney et Salesforce utilisent intensivement Cloud TPU
- Et toute cette puissance de calcul n’en est encore qu’à ses débuts
- À l’avenir, l’entreprise prévoit de faire évoluer la conception des datacenters pour mieux l’adapter aux exigences des TPU
- Au-delà de la puce unique ou du pod TPU unique, Google construit un réseau mondial de datacenters remplis de TPU
- L’avenir sera celui d’une personnalisation full stack de bout en bout, du silicium au béton (
The future is full stack customization all the way, from silicon to concrete)
2 commentaires
Les TPU avaient vraiment une longueur d’avance
Google l’a bien montré avec le traitement photo à caméra unique du Pixel 2 XL, et ils connaissent aujourd’hui leur âge d’or à l’ère des LLM
Alors, une petite mise à jour de la carte Coral Micro Dev, s’il vous plaît.... snif snif snif snif
Le processeur d’image inclus dans les premiers modèles de Pixel (appelé Visual Core) est basé sur la plateforme Monette Hill d’Intel.