13 points par xguru 2020-12-23 | Aucun commentaire pour le moment. | Partager sur WhatsApp

"Run inference at scale"

  • Prend en charge de nombreux modèles, dont TensorFlow, PyTorch et Sklearn

  • Déploiement à grande échelle sur AWS/GCP/Azure avec autoscaling basé sur les requêtes

  • Intégration avec les systèmes CI/CD

  • Diffusion des métriques de performance et des logs vers des outils de monitoring

  • Service efficace de nombreux modèles grâce au cache multi-modèle

  • Prise en charge des mises à jour progressives sans interruption

  • Répartition du trafic pour les tests A/B

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.