10 points par xguru 2023-06-22 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Prend en charge différents types de LLM pour l’inférence et le déploiement
    • StableLM, Falcon, DOlly, Flan-T5, ChatGLM, StarCoder,..
  • Sert des LLM via une API RESTful ou gRPC avec une seule commande
    • Appelable depuis WebUI, CLI, un client Python/Javascript ou tout client HTTP
  • Prise en charge intégrée de LangChain, BentoML et HuggingFace
  • Prise en charge du fine-tuning des LLM prévue

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.