KoAlpaca - modèle Alpaca en coréen
(github.com/Beomi)- Entraîné selon la même méthode que le modèle Alpaca de Stanford
- Utilise Polyglot-ko 5.8B et LLaMA 7B comme modèles de base
- Les performances en coréen de LLaMA sont faibles, car l'entraînement sur des jeux de données coréens est insuffisant ; un modèle coréen a donc été entraîné en plus
- Le jeu de données de 52k instructions de LLaMA a été traduit avec l'API DeepL
1 commentaires
Oh… cet écosystème évolue vraiment à une vitesse incroyable. Même avec les modèles Transformer existants, l’écart de performances entre les modèles localisés pour le coréen et les modèles généralistes est énorme, donc c’est un excellent projet open source.