37 points par ironlung 2024-08-26 | 1 commentaires | Partager sur WhatsApp
  • KitOps : prend en charge les packages utilisés pour partager et gérer des modèles, du code, des métadonnées et des artefacts
  • LangChain : aide au développement d’applications LLM personnalisées grâce à une architecture modulaire
  • Pachyderm : automatise les transformations de données
  • ZenML : aide au prétraitement des données, à l’entraînement, à l’évaluation et au déploiement des modèles grâce à une couche d’abstraction pour créer des pipelines MLOps
  • Prefect : permet de construire des pipelines de machine learning autour des concepts de tâches et de flux
  • Ray : facilite la mise à l’échelle des charges de travail de machine learning pendant le développement des modèles
  • Metaflow : fournit une API unifiée pour exécuter des projets IA du prototype à la production
  • MLflow : aide les data scientists et les ingénieurs à gérer le développement des modèles et les expérimentations
  • Kubeflow : conçu pour simplifier l’orchestration et le déploiement de workflows ML sur des clusters Kubernetes
  • Seldon core : simplifie le déploiement, la mise à disposition et la gestion des modèles ML en transformant des modèles ML (TensorFlow, PyTorch, H2o, etc.) ou des wrappers de langage (Python, Java, etc.) en microservices REST/GRPC prêts pour la production
  • DVC : suit les modifications des données et des modèles comme Git le fait pour le code, et peut fonctionner au-dessus de n’importe quel dépôt Git
  • Evidently AI : plateforme d’observabilité conçue pour analyser et surveiller les modèles ML en production
  • Mage AI : framework d’intégration et de transformation des données permettant de créer et d’automatiser des pipelines de données sans recourir à beaucoup de code
  • ML Run : fournit une technologie serverless pour orchestrer un système MLOps de bout en bout
  • Kedro : framework de développement ML destiné à produire du code de data science reproductible, maintenable et modulaire
  • WhyLogs : bibliothèque open source de journalisation de données conçue pour les modèles ML et les pipelines de données
  • Feast : résout les problématiques de gestion et de mise à disposition des features ML entre développement et production
  • Flyte : fournit aux data scientists et aux ingénieurs data/analytics un SDK Python pour créer des workflows et les déployer facilement sur le backend Flyte
  • Featureform : feature store virtuel qui simplifie la gestion et la mise à disposition des features pour les modèles ML
  • Deepchecks : outil de monitoring ML qui teste et valide en continu les modèles ML et les données, de l’expérimentation au déploiement des projets IA
  • Argo : fournit un moteur de workflow natif Kubernetes pour orchestrer des tâches parallèles sur Kubernetes
  • Deep Lake : outil de base de données spécialisé ML conçu pour servir de data lake pour le deep learning et de vector store pour les applications RAG
  • Hopsworks feature store : fournit une solution de bout en bout pour gérer le cycle de vie des features ML, de l’ingestion des données et du feature engineering à l’entraînement, au déploiement et au monitoring des modèles
  • NannyML : bibliothèque Python spécialisée dans le monitoring et la maintenance des modèles ML après leur déploiement
  • Delta Lake : framework de couche de stockage qui apporte de la fiabilité aux data lakes

1 commentaires

 
chshin84 2024-08-27

Waouh, quelle liste en or
Ce serait bien d’ajouter Optuna