5 points par xguru 2024-09-12 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Solar Pro est le LLM le plus intelligent optimisé pour fonctionner sur un seul GPU, surpassant les modèles de géants technologiques comme Microsoft, Meta et Google
  • La version preview est proposée comme modèle open source avec un accès API gratuit, permettant aux développeurs et aux entreprises de tester le modèle et de fournir des retours avant son lancement officiel en novembre
  • Il prend en charge 22 milliards de paramètres, soit plus du double du modèle précédent, Solar Mini
  • Grâce à la méthode propriétaire Depth-Up Scaling (DUS) d’Upstage et à une recette de données avancée, Solar Pro offre des performances de pointe tout en réduisant considérablement la taille du modèle
  • Il a atteint un score de précision de 52,11 sur le benchmark MMLU Pro et de 84,37 sur le benchmark IFEval
  • Ces résultats dépassent ceux de modèles de taille comparable comme Phi 3 Medium de Microsoft, Llama 3.1 8B de Meta, Mistral NeMo 12B et Gemma 2 27B de Google
  • L’aperçu de Solar Pro est accessible publiquement, avec un accès API gratuit, en tant que modèle open source, y compris pour des applications commerciales, jusqu’à sa sortie officielle en novembre
  • La version preview prend en charge les entrées en anglais et offre une fenêtre de contexte de 496 tokens

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.