KoAlpaca - modèle Alpaca en coréen

xguru · 2023-03-19T10:49:01+09:00

Entraîné selon la même méthode que le modèle Alpaca de Stanford Utilise Polyglot-ko 5.8B et LLaMA 7B comme modèles de base Les performances en coréen de LLaMA sont faibles, car l'entraînement sur des jeux de données coréens est insuffisant ; un modèle coréen a donc été entraîné en plus Le jeu de données de 52k instructions de LLaMA a été traduit avec l'API DeepL

(github.com/Beomi)

33 points par xguru 2023-03-19 | 1 commentaires | Partager sur WhatsApp

Entraîné selon la même méthode que le modèle Alpaca de Stanford
Utilise Polyglot-ko 5.8B et LLaMA 7B comme modèles de base
- Les performances en coréen de LLaMA sont faibles, car l'entraînement sur des jeux de données coréens est insuffisant ; un modèle coréen a donc été entraîné en plus
Le jeu de données de 52k instructions de LLaMA a été traduit avec l'API DeepL

1 commentaires

luckydaun 2023-03-19

Oh… cet écosystème évolue vraiment à une vitesse incroyable. Même avec les modèles Transformer existants, l’écart de performances entre les modèles localisés pour le coréen et les modèles généralistes est énorme, donc c’est un excellent projet open source.

KoAlpaca - modèle Alpaca en coréen

À lire aussi

1 commentaires