- Le modèle de langage le plus puissant à ce jour
- Modèle de 7,3B paramètres, il surpasse Llama 2 13B sur tous les benchmarks, et Llama 1 34B sur de nombreux benchmarks
- Utilise Grouped-query attention (GQA) pour une inférence plus rapide et Sliding Window Attention (SWA) pour traiter des séquences plus longues à moindre coût
- Sous licence Apache 2.0, utilisable sans restriction
- Peut être déployé sur n’importe quel cloud (AWS/GCP/Azure) avec le serveur d’inférence vLLM et skypilot, et peut aussi être utilisé sur HuggingFace
- Facile à affiner, et le modèle affiné pour le chat surpasse Llama 2 13B Chat
1 commentaires
Avis Hacker News