16 points par xguru 2023-05-08 | 3 commentaires | Partager sur WhatsApp
  • Modèle de 15,5B entraîné sur 1 billion de tokens couvrant plus de 80 langages de programmation
  • Utilise MQA pour une génération efficace et dispose d'une fenêtre de contexte de 8192 tokens
    • StarCoderBase : entraîné sur le jeu de données The-Stack v1.2 (6 To), contenant des données de plus de 80 langages
    • StarCoder : modèle davantage entraîné sur Python
  • Démo de chat et extension pour VSCode disponibles

3 commentaires

 
ninebow 2023-05-08

Voici le lien vers l’article mentionné dans le post d’annonce sur Twitter. :)

https://drive.google.com/file/d/1cN-b9GnWtHzQRoE7M7gAEyivY0kl4BYs/view

 
ninebow 2023-05-08

Il est aussi disponible directement dans HuggingFace Chat. :)
https://huggingface.co/chat/?model=bigcode/starcoder