4 points par GN⁺ 2023-09-03 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Cloud TPU v5e

  • Le Cloud TPU le plus rentable, polyvalent et évolutif, avec une intégration aux principaux frameworks tels que Google Kubernetes Engine (GKE), Vertex AI, Pytorch, JAX et TensorFlow
  • Offre, par rapport au Cloud TPU v4, jusqu’à 2 fois plus de performances d’entraînement par dollar et jusqu’à 2,5 fois plus de performances d’inférence pour les LLM et les modèles d’IA générative
  • Prend en charge 8 configurations différentes de machines virtuelles (VM) afin de permettre le choix d’une configuration adaptée à diverses tailles de LLM et de modèles d’IA générative
  • Grâce à la technologie Multislice, les utilisateurs peuvent faire évoluer leurs modèles d’IA au-delà des limites physiques d’un pod TPU vers des dizaines de milliers de puces Cloud TPU v5e ou TPU v4

A3 GPU VM

  • Équipée des GPU NVIDIA H100 Tensor Core. Spécialement conçue pour entraîner et servir des charges de travail d’IA générative et des LLM particulièrement exigeants, elle sera disponible de manière générale le mois prochain
  • Les VM A3 offrent un entraînement 3 fois plus rapide et une bande passante réseau 10 fois supérieure à la génération précédente, pour une échelle et des performances de très grande ampleur

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.