13 points par xguru 2024-04-29 | 3 commentaires | Partager sur WhatsApp
  • Depuis la présentation du modèle Llama 3 le 18/04, la réaction de la communauté des développeurs a été énorme
    • le modèle a été téléchargé plus de 1,2 million de fois, et les développeurs ont partagé plus de 600 modèles dérivés sur Hugging Face
    • le dépôt GitHub de Llama 3 a reçu plus de 17 000 étoiles
    • dans le classement LMSYS Chatbot Arena, le modèle Llama 3 70B Instruct a pris la 1re place dans l’évaluation en anglais uniquement et s’est classé 6e au général, ce qui en fait le modèle ouvert le mieux classé (derrière les modèles propriétaires fermés)

Premiers cas d’usage de Llama 3

  • des partenaires dans les semi-conducteurs, le matériel et le cloud ont commencé à déployer Llama 3 auprès de leurs utilisateurs
  • à la faculté de médecine de Yale, en collaboration avec l’École d’informatique et de communication de l’EPFL, Llama 3 a été fine-tuné dans les 24 heures suivant sa sortie, avec la présentation de Llama-3[8B]-MeditronV1.0, le premier modèle Llama 3 8B pour le domaine médical
    • ce nouveau modèle a surpassé tous les modèles ouverts récents de la même catégorie de paramètres sur des benchmarks standard comme MedQA et MedMCQA
    • plus de détails sur la manière dont Yale et l’EPFL ont construit la première version de Meditron à partir de Llama 2 sont disponibles via le lien correspondant

Feuille de route de Llama 3

  • dans les prochains mois, des modèles dotés de nouvelles fonctionnalités seront publiés, notamment le multimodal, les conversations multilingues, des fenêtres de contexte plus longues et des améliorations globales des capacités
  • davantage d’informations seront partagées prochainement, avec l’espoir de voir émerger la prochaine vague d’innovation portée par la communauté

3 commentaires

 
gcback 2024-04-29

Les LLM des grands groupes coréens perdent de plus en plus en compétitivité. Si leur stratégie est de rester fermés, ils devraient au moins être suffisamment compétitifs en termes de performances ; ou bien, si leur stratégie est d’élargir les cas d’usage malgré des performances inférieures, ils ne devraient pas mettre en avant le coréen comme argument central. Or, ils font exactement l’inverse.

 
cosine20 2024-04-30

Sur le leaderboard coréen, ils ne font qu’une compétition de poids dénuée de sens, puis en font des articles pour soutenir le cours de l’action, lol

 
[Ce commentaire a été masqué.]