Yi - LLM bilingue open source de nouvelle génération
(github.com/01-ai)- Modèle de langage de grande taille open source de nouvelle génération, entraîné de zéro par des développeurs
- Conçu comme un modèle bilingue et entraîné sur un corpus multilingue de 3T, il affiche de solides performances en compréhension du langage, raisonnement de bon sens et compréhension de lecture
- Basé sur des modèles de langage préentraînés 6B et 34B, puis étendu en modèles de chatbot, modèles à long contexte 200K, modèles d’upscaling en profondeur et modèles vision-langage
- Le modèle Yi-34B-Chat
- s’est classé 2e sur le leaderboard AlpacaEval derrière GPT-4 Turbo, dépassant les autres LLM
- surpasse les modèles open source existants en anglais comme en chinois et se classe 1er sur divers benchmarks
- Il adopte la même architecture de modèle que Llama, mais n’est pas un modèle dérivé de Llama. Il n’utilise pas les poids de Llama
- Disponible en plusieurs tailles, avec possibilité de fine-tuning du modèle selon des besoins spécifiques
- Modèles de chat
- Yi-34B-Chat, Yi-34B-Chat-4bits, Yi-34B-Chat-8bits
- Yi-6B-Chat, Yi-6B-Chat-4bits, Yi-6B-Chat-8bits
- Modèles de base
- Yi-34B, Yi-34B-200K
- Yi-9B
- Yi-6B, Yi-6B-200K
- Modèles de chat
1 commentaires
Avis sur Hacker News