- KitOps : prend en charge les packages utilisés pour partager et gérer des modèles, du code, des métadonnées et des artefacts
- LangChain : aide au développement d’applications LLM personnalisées grâce à une architecture modulaire
- Pachyderm : automatise les transformations de données
- ZenML : aide au prétraitement des données, à l’entraînement, à l’évaluation et au déploiement des modèles grâce à une couche d’abstraction pour créer des pipelines MLOps
- Prefect : permet de construire des pipelines de machine learning autour des concepts de tâches et de flux
- Ray : facilite la mise à l’échelle des charges de travail de machine learning pendant le développement des modèles
- Metaflow : fournit une API unifiée pour exécuter des projets IA du prototype à la production
- MLflow : aide les data scientists et les ingénieurs à gérer le développement des modèles et les expérimentations
- Kubeflow : conçu pour simplifier l’orchestration et le déploiement de workflows ML sur des clusters Kubernetes
- Seldon core : simplifie le déploiement, la mise à disposition et la gestion des modèles ML en transformant des modèles ML (TensorFlow, PyTorch, H2o, etc.) ou des wrappers de langage (Python, Java, etc.) en microservices REST/GRPC prêts pour la production
- DVC : suit les modifications des données et des modèles comme Git le fait pour le code, et peut fonctionner au-dessus de n’importe quel dépôt Git
- Evidently AI : plateforme d’observabilité conçue pour analyser et surveiller les modèles ML en production
- Mage AI : framework d’intégration et de transformation des données permettant de créer et d’automatiser des pipelines de données sans recourir à beaucoup de code
- ML Run : fournit une technologie serverless pour orchestrer un système MLOps de bout en bout
- Kedro : framework de développement ML destiné à produire du code de data science reproductible, maintenable et modulaire
- WhyLogs : bibliothèque open source de journalisation de données conçue pour les modèles ML et les pipelines de données
- Feast : résout les problématiques de gestion et de mise à disposition des features ML entre développement et production
- Flyte : fournit aux data scientists et aux ingénieurs data/analytics un SDK Python pour créer des workflows et les déployer facilement sur le backend Flyte
- Featureform : feature store virtuel qui simplifie la gestion et la mise à disposition des features pour les modèles ML
- Deepchecks : outil de monitoring ML qui teste et valide en continu les modèles ML et les données, de l’expérimentation au déploiement des projets IA
- Argo : fournit un moteur de workflow natif Kubernetes pour orchestrer des tâches parallèles sur Kubernetes
- Deep Lake : outil de base de données spécialisé ML conçu pour servir de data lake pour le deep learning et de vector store pour les applications RAG
- Hopsworks feature store : fournit une solution de bout en bout pour gérer le cycle de vie des features ML, de l’ingestion des données et du feature engineering à l’entraînement, au déploiement et au monitoring des modèles
- NannyML : bibliothèque Python spécialisée dans le monitoring et la maintenance des modèles ML après leur déploiement
- Delta Lake : framework de couche de stockage qui apporte de la fiabilité aux data lakes
1 commentaires
Waouh, quelle liste en or
Ce serait bien d’ajouter Optuna