3 points par mscheong01 2024-04-22 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Il s'agit d'un code d'inférence simple de speculative decoding implémenté en C.
Je l'ai écrit comme un code simple à visée pédagogique, à l'image de llama2.c sur lequel il s'appuie.
Ensuite, je prévois d'implémenter des articles un peu plus récents.

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.