9 points par xguru 2022-12-10 | 1 commentaires | Partager sur WhatsApp
  • Dévoilé discrètement via un commit sur GitHub
  • Entraîné avec davantage d’epochs* ainsi qu’une normalisation, il affiche de meilleures performances que le modèle précédent
  • Même architecture que précédemment
  • Lors de l’appel à load_model("large"), le modèle large-v2 est chargé
  • Un article de recherche lié à ce modèle devrait être publié prochainement
  • Epoch : unité d’apprentissage correspondant à un passage complet de l’ensemble du jeu de données d’entraînement dans le modèle (Forward Pass/Backward Pass)