25 outils IA open source pour réduire de moitié votre temps de développement

ironlung · 2024-08-26T21:31:19+09:00

KitOps : prend en charge les packages utilisés pour partager et gérer des modèles, du code, des métadonnées et des artefacts LangChain : aide au développement d’applications LLM personnalisées grâce à une architecture modulaire Pachyderm : automatise les transformations de données ZenML : aide au prétraitement des données, à l’entraînement, à l’évaluation et au déploiement des modèles grâce à une couche d’abstraction pour créer des pipelines MLOps Prefect : permet de construire des pipelines de machine learning autour des concepts de tâches et de flux Ray : facilite la mise à l’échelle des charges de travail de machine learning pendant le développement des modèles Metaflow : fournit une API unifiée pour exécuter des projets IA du prototype à la production MLflow : aide les data scientists et les ingénieurs à gérer le développement des modèles et les expérimentations Kubeflow : conçu pour simplifier l’orchestration et le déploiement de workflows ML sur des clusters Kubernetes Seldon core : simplifie le déploiement, la mise à disposition et la gestion des modèles ML en transformant des modèles ML (TensorFlow, PyTorch, H2o, etc.) ou des wrappers de langage (Python, Java, etc.) en microservices REST/GRPC prêts pour la production DVC : suit les modifications des données et des modèles comme Git le fait pour le code, et peut fonctionner au-dessus de n’importe quel dépôt Git Evidently AI : plateforme d’observabilité conçue pour analyser et surveiller les modèles ML en production Mage AI : framework d’intégration et de transformation des données permettant de créer et d’automatiser des pipelines de données sans recourir à beaucoup de code ML Run : fournit une technologie serverless pour orchestrer un système MLOps de bout en bout Kedro : framework de développement ML destiné à produire du code de data science reproductible, maintenable et modulaire WhyLogs : bibliothèque open source de journalisation de données conçue pour les modèles ML et les pipelines de données Feast : résout les problématiques de gestion et de mise à disposition des features ML entre développement et production Flyte : fournit aux data scientists et aux ingénieurs data/analytics un SDK Python pour créer des workflows et les déployer facilement sur le backend Flyte Featureform : feature store virtuel qui simplifie la gestion et la mise à disposition des features pour les modèles ML Deepchecks : outil de monitoring ML qui teste et valide en continu les modèles ML et les données, de l’expérimentation au déploiement des projets IA Argo : fournit un moteur de workflow natif Kubernetes pour orchestrer des tâches parallèles sur Kubernetes Deep Lake : outil de base de données spécialisé ML conçu pour servir de data lake pour le deep learning et de vector store pour les applications RAG Hopsworks feature store : fournit une solution de bout en bout pour gérer le cycle de vie des features ML, de l’ingestion des données et du feature engineering à l’entraînement, au déploiement et au monitoring des modèles NannyML : bibliothèque Python spécialisée dans le monitoring et la maintenance des modèles ML après leur déploiement Delta Lake : framework de couche de stockage qui apporte de la fiabilité aux data lakes

(jozu.com)

37 points par ironlung 2024-08-26 | 1 commentaires | Partager sur WhatsApp

KitOps : prend en charge les packages utilisés pour partager et gérer des modèles, du code, des métadonnées et des artefacts
LangChain : aide au développement d’applications LLM personnalisées grâce à une architecture modulaire
Pachyderm : automatise les transformations de données
ZenML : aide au prétraitement des données, à l’entraînement, à l’évaluation et au déploiement des modèles grâce à une couche d’abstraction pour créer des pipelines MLOps
Prefect : permet de construire des pipelines de machine learning autour des concepts de tâches et de flux
Ray : facilite la mise à l’échelle des charges de travail de machine learning pendant le développement des modèles
Metaflow : fournit une API unifiée pour exécuter des projets IA du prototype à la production
MLflow : aide les data scientists et les ingénieurs à gérer le développement des modèles et les expérimentations
Kubeflow : conçu pour simplifier l’orchestration et le déploiement de workflows ML sur des clusters Kubernetes
Seldon core : simplifie le déploiement, la mise à disposition et la gestion des modèles ML en transformant des modèles ML (TensorFlow, PyTorch, H2o, etc.) ou des wrappers de langage (Python, Java, etc.) en microservices REST/GRPC prêts pour la production
DVC : suit les modifications des données et des modèles comme Git le fait pour le code, et peut fonctionner au-dessus de n’importe quel dépôt Git
Evidently AI : plateforme d’observabilité conçue pour analyser et surveiller les modèles ML en production
Mage AI : framework d’intégration et de transformation des données permettant de créer et d’automatiser des pipelines de données sans recourir à beaucoup de code
ML Run : fournit une technologie serverless pour orchestrer un système MLOps de bout en bout
Kedro : framework de développement ML destiné à produire du code de data science reproductible, maintenable et modulaire
WhyLogs : bibliothèque open source de journalisation de données conçue pour les modèles ML et les pipelines de données
Feast : résout les problématiques de gestion et de mise à disposition des features ML entre développement et production
Flyte : fournit aux data scientists et aux ingénieurs data/analytics un SDK Python pour créer des workflows et les déployer facilement sur le backend Flyte
Featureform : feature store virtuel qui simplifie la gestion et la mise à disposition des features pour les modèles ML
Deepchecks : outil de monitoring ML qui teste et valide en continu les modèles ML et les données, de l’expérimentation au déploiement des projets IA
Argo : fournit un moteur de workflow natif Kubernetes pour orchestrer des tâches parallèles sur Kubernetes
Deep Lake : outil de base de données spécialisé ML conçu pour servir de data lake pour le deep learning et de vector store pour les applications RAG
Hopsworks feature store : fournit une solution de bout en bout pour gérer le cycle de vie des features ML, de l’ingestion des données et du feature engineering à l’entraînement, au déploiement et au monitoring des modèles
NannyML : bibliothèque Python spécialisée dans le monitoring et la maintenance des modèles ML après leur déploiement
Delta Lake : framework de couche de stockage qui apporte de la fiabilité aux data lakes

1 commentaires

chshin84 2024-08-27

Waouh, quelle liste en or
Ce serait bien d’ajouter Optuna

25 outils IA open source pour réduire de moitié votre temps de développement

À lire aussi

1 commentaires