- Un grand modèle de langage open source utilisable à la fois pour la recherche et les usages commerciaux
- Entraîné sur 2 billions de tokens de données, soit 40 % de plus que Llama 1
- Longueur de contexte doublée : 4096
- Trois tailles de modèle : 7B, 13B, 70B
- Excellentes performances, supérieures à celles d'autres modèles de langage open source, dans de nombreux benchmarks tels que le raisonnement, le code, la maîtrise et les tests de connaissances (MPT, Falcon, Llama-1)
- Entraîné à partir de sources de données publiques, et la version fine-tunée Llama-2-chat s'appuie également sur des jeux d'instructions publics ainsi que sur plus d'un million d'annotations humaines
- Utilise le Reinforcement Learning from Human Feedback (RLHF), y compris le Rejection Sampling et le Proximal Policy Optimization (PPO)
- Inclus dans le téléchargement
- Code du modèle
- Poids du modèle
- README (guide d'utilisation)
- Guide d'utilisation responsable
- Licence
- Politique d'utilisation acceptable
- Fiche du modèle
1 commentaires
Avis sur Hacker News