8 points par xguru 2024-08-06 | 2 commentaires | Partager sur WhatsApp
  • Il y a environ 10 ans, les chercheurs de Google ont anticipé que la demande en calcul pour l’IA dépasserait les capacités de l’infrastructure de l’époque
  • Constatant qu’aucune alternative sur le marché ne permettrait de répondre à cette demande, ils ont commencé à développer un nouveau type de puce, le TPU (Tensor Processing Unit)

Une puce à objectif unique

  • Alors que le CPU joue le rôle de « cerveau » polyvalent de l’ordinateur, le TPU est une puce à usage spécifique optimisée pour l’IA
  • Le TPU est un ASIC (application-specific integrated circuit) spécialisé dans les opérations mathématiques basées sur des matrices et des vecteurs, nécessaires à la création et à l’exécution des modèles d’IA
  • Déployé en interne en 2015, le TPU v1 a immédiatement rencontré un grand succès chez Google, et au cours des 10 années suivantes, les TPU ont continué à progresser en matière de performances et d’efficacité

Suivre le rythme de l’innovation en IA

  • L’évolution des TPU est étroitement liée aux innovations en machine learning et en IA
  • Le TPU v1 était centré sur l’inférence, mais Google a rapidement développé le supercalculateur d’entraînement TPU v2 afin d’améliorer l’efficacité de l’entraînement des modèles
  • Par la suite, les TPU ont été lancés à un rythme plus soutenu, avec des bonds majeurs en performances, en efficacité et en capacité de traitement
  • Dans les générations les plus récentes, la vitesse de traitement des données est si élevée qu’il faut même prêter attention au câblage des connexions entre les puces

Partager l’innovation

  • À ses débuts, Google n’était pas le seul à chercher une meilleure façon de développer et d’exécuter des modèles d’IA
  • Début 2018, Google Cloud a lancé la première génération de Cloud TPU afin d’aider ses clients à accélérer leurs propres charges de travail d’entraînement et d’inférence
  • Aujourd’hui, des équipes IA bien connues comme Anthropic, Midjourney et Salesforce utilisent intensivement Cloud TPU
  • Et toute cette puissance de calcul n’en est encore qu’à ses débuts
  • À l’avenir, l’entreprise prévoit de faire évoluer la conception des datacenters pour mieux l’adapter aux exigences des TPU
  • Au-delà de la puce unique ou du pod TPU unique, Google construit un réseau mondial de datacenters remplis de TPU
  • L’avenir sera celui d’une personnalisation full stack de bout en bout, du silicium au béton (The future is full stack customization all the way, from silicon to concrete)

2 commentaires

 
ing03201 2024-08-06

Les TPU avaient vraiment une longueur d’avance
Google l’a bien montré avec le traitement photo à caméra unique du Pixel 2 XL, et ils connaissent aujourd’hui leur âge d’or à l’ère des LLM
Alors, une petite mise à jour de la carte Coral Micro Dev, s’il vous plaît.... snif snif snif snif

 
ganadist 2024-08-06

Le processeur d’image inclus dans les premiers modèles de Pixel (appelé Visual Core) est basé sur la plateforme Monette Hill d’Intel.