Meta dévoile Llama 2, son modèle de langage de nouvelle génération

xguru · 2023-07-19T10:02:01+09:00

Un grand modèle de langage open source utilisable à la fois pour la recherche et des usages commerciaux Entraîné sur 2 billions de tokens, soit 40 % de plus que Llama 1 Longueur de contexte doublée : 4096 Trois tailles de modèle : 7B, 13B, 70B De meilleures performances que d’autres modèles de langage open source sur de nombreux benchmarks, notamment en raisonnement, en code, en maîtrise et en tests de connaissances (MPT, Falcon, Llama-1) Entraîné à partir de sources de données publiques, et le modèle affiné Llama-2-chat s’appuie également sur des jeux d’instructions publics et plus d’un million d’annotations humaines Inclus dans le téléchargement Code du modèle Poids du modèle README (guide utilisateur) Guide d’utilisation responsable Licence Politique d’utilisation acceptable Model Card

(ai.meta.com)

19 points par xguru 2023-07-19 | 3 commentaires | Partager sur WhatsApp

Un grand modèle de langage open source utilisable à la fois pour la recherche et des usages commerciaux
Entraîné sur 2 billions de tokens, soit 40 % de plus que Llama 1
Longueur de contexte doublée : 4096
Trois tailles de modèle : 7B, 13B, 70B
De meilleures performances que d’autres modèles de langage open source sur de nombreux benchmarks, notamment en raisonnement, en code, en maîtrise et en tests de connaissances (MPT, Falcon, Llama-1)
Entraîné à partir de sources de données publiques, et le modèle affiné Llama-2-chat s’appuie également sur des jeux d’instructions publics et plus d’un million d’annotations humaines
Inclus dans le téléchargement
- Code du modèle
- Poids du modèle
- README (guide utilisateur)
- Guide d’utilisation responsable
- Licence
- Politique d’utilisation acceptable
- Model Card

3 commentaires

kuroneko 2023-07-19

Cette fois encore, quelqu’un va-t-il diffuser un lien magnet torrent au nom de l’« intérêt général » ?

tpdns90321 2023-07-19

Cette fois, pas besoin de cela, c'est publié directement.

xguru 2023-07-19

Il y a des différences selon les domaines, mais les évaluations le placent globalement au niveau de GPT-3.5, voire au-dessus.

Cela semble totalement open source, mais il y a une contrainte importante : si c’est un « service dépassant 700 millions de MAU », il faut demander une licence à Meta, qui peut la refuser.

On dirait en gros : « Google, TikTok, vous n’avez pas le droit de l’utiliser ! »

Microsoft a rapidement annoncé que Llama 2 pouvait être utilisé sur Azure.
https://blogs.microsoft.com/blog/2023/…

On dirait que Microsoft entretient de bonnes relations aussi bien avec OpenAI qu’avec Meta.

Meta dévoile Llama 2, son modèle de langage de nouvelle génération

À lire aussi

3 commentaires