MPT-7B, un LLM open source utilisable commercialement

xguru · 2023-05-09T09:41:02+09:00

Un transformeur entraîné sur 1 billion de tokens Une qualité comparable à LLaMA-7B, mais open source et utilisable commercialement Trois modèles de fine-tuning supplémentaires également publiés MPT-7B-Instruct, MPT-7B-Chat, MPT-7B-StoryWriter-65K+ (prise en charge de 65K tokens) Entraîné sur la plateforme MosaicML pendant 9,5 jours pour un coût d’environ 200 K$, avec la possibilité d’entraîner, de fine-tuner et de déployer son propre modèle MPT MPT : Mosaic Pretrained Transformers

(mosaicml.com)

14 points par xguru 2023-05-09 | 2 commentaires | Partager sur WhatsApp

Un transformeur entraîné sur 1 billion de tokens
Une qualité comparable à LLaMA-7B, mais open source et utilisable commercialement
Trois modèles de fine-tuning supplémentaires également publiés
- MPT-7B-Instruct, MPT-7B-Chat, MPT-7B-StoryWriter-65K+ (prise en charge de 65K tokens)
Entraîné sur la plateforme MosaicML pendant 9,5 jours pour un coût d’environ 200 K$, avec la possibilité d’entraîner, de fine-tuner et de déployer son propre modèle MPT
MPT : Mosaic Pretrained Transformers

2 commentaires

kuroneko 2023-05-09

Ces derniers temps, quand on voit l’énorme quantité de modèles LLM open source utilisables commercialement qui sortent,
on a l’impression qu’ils sont en concurrence pour devenir le Stable Diffusion du monde des LLM.

J’ai hâte de voir qui sera le grand gagnant. +_+

xguru 2023-05-09

Je pense que c’est une bonne option de commencer le développement en l’intégrant d’abord avec ChatGPT, puis de le remplacer plus tard par l’open source le plus avancé.

MPT-7B, un LLM open source utilisable commercialement

À lire aussi

2 commentaires