Alpaca : un puissant modèle open source de suivi d’instructions au niveau de GPT-3.5

xguru · 2023-03-14T11:21:01+09:00

Au CRFM de Stanford, le LLaMA 7B de Meta a été affiné à l’aide de 52K données de suivi d’instructions Se comporte de façon similaire à GPT-3.5 d’OpenAI (text-davinci-003), tout en étant bien plus petit et moins coûteux La recette d’entraînement et les données sont publiées, et les poids du modèle devraient aussi être publiés ultérieurement Publié uniquement à des fins de recherche, utilisation commerciale interdite Le fine-tuning a pris 3 heures sur 8 A100 de 80 Go, et peut être réalisé dans le cloud pour moins d’environ 100 dollars

(crfm.stanford.edu)

19 points par xguru 2023-03-14 | 1 commentaires | Partager sur WhatsApp

Au CRFM de Stanford, le LLaMA 7B de Meta a été affiné à l’aide de 52K données de suivi d’instructions
Se comporte de façon similaire à GPT-3.5 d’OpenAI (text-davinci-003), tout en étant bien plus petit et moins coûteux
La recette d’entraînement et les données sont publiées, et les poids du modèle devraient aussi être publiés ultérieurement
Publié uniquement à des fins de recherche, utilisation commerciale interdite
Le fine-tuning a pris 3 heures sur 8 A100 de 80 Go, et peut être réalisé dans le cloud pour moins d’environ 100 dollars

1 commentaires

xguru 2023-03-14

Repo : https://github.com/tatsu-lab/stanford_alpaca
Démo web : https://crfm.stanford.edu/alpaca/

La publication de LLaMA est vraiment en train de créer un moment Stable Diffusion. Les choses évoluent à une vitesse impressionnante.

Alpaca : un puissant modèle open source de suivi d’instructions au niveau de GPT-3.5

À lire aussi

1 commentaires