speculative_decoding.c : code C de speculative decoding écrit à partir de llama2.c
(github.com/mscheong01)Il s'agit d'un code d'inférence simple de speculative decoding implémenté en C.
Je l'ai écrit comme un code simple à visée pédagogique, à l'image de llama2.c sur lequel il s'appuie.
Ensuite, je prévois d'implémenter des articles un peu plus récents.
Aucun commentaire pour le moment.