21 points par xguru 2023-03-27 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Modèle ajusté à partir de Stanford Alpaca 7B/13B pour être plus adapté aux développeurs dans les tâches de programmation
  • Remplacement par un jeu de 20K données d’Instruction Following liées à la génération de code (en utilisant la technique Self-Instruct)
  • Modification partielle du pipeline de génération de données : changement des prompts pour les orienter vers la génération, l’édition et l’optimisation de code plutôt que vers des tâches générales
  • Fine-tuning avec le code d’entraînement Hugging Face et Deepspeed

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.