19 points par kuroneko 2023-05-04 | 2 commentaires | Partager sur WhatsApp
  • Replit a publié un nouveau LLM de génération de code en open source, autorisé pour un usage commercial.
  • Avec 2,7B paramètres, il est léger et rapide, et son entraînement a été achevé en seulement 10 jours.
  • Il affiche une amélioration des performances de 40 % par rapport aux modèles de la même catégorie, et le modèle affiné est plus performant que Codex.
  • Il a été entraîné sur le dataset The Stack et peut générer du code dans plus de 20 langages.
  • Une démo est disponible directement sur Hugging Face.

2 commentaires

 
kuroneko 2023-05-04

J’ai l’impression qu’il y a de plus en plus de LLM open source utilisables à des fins commerciales ces derniers temps. Sans doute sous l’impulsion de LLaMA...

Et j’apprécie le fait que les performances se soient nettement améliorées par rapport à la taille du modèle.
À ce niveau, je me dis qu’on est peut-être sur quelque chose qui peut tourner en local sur un ordinateur de développement classique (sans GPU).