- Basé sur Vicuna v0 13B, avec instruction fine-tuning et entraînement RLHF
- SFT (Supervised Fine-Tuning) réalisé à l’aide de 3 jeux de données
- OpenAssistant Conversations Dataset (OASST1)
- GPT4All Prompt Generations
- Alpaca
- Téléchargeable sur HuggingFace sous forme de delta de poids pour le modèle LLaMA (les données originales de LLaMA sont requises)
Aucun commentaire pour le moment.