- L'équipe de Mistral AI a lancé un modèle de 24B paramètres, Mistral Small 3, sous licence Apache 2.0.
- Ce modèle peut rivaliser avec des modèles plus grands comme Llama 3.3 70B ou Qwen 32B, et constitue une bonne alternative à des modèles propriétaires comme GPT4o-mini.
- Mistral Small 3 a été conçu dans une taille adaptée au déploiement local, avec moins de couches afin de réduire le temps de traitement.
- Il affiche plus de 81 % de précision sur MMLU, avec une latence de 150 tokens/s.
Performances
Évaluation humaine
- Plus de 1 000 ensembles de prompts de code et de prompts généraux ont été évalués avec un prestataire externe.
- Les réponses de Mistral Small 3 ont été comparées à celles d'autres modèles afin de mesurer les préférences.
- Un soin particulier a été apporté à l'équité de l'évaluation, et la validité du benchmark est considérée comme fiable.
Performances en suivi d'instructions
- Le modèle ajusté pour le suivi d'instructions affiche des performances compétitives face à des modèles ouverts trois fois plus grands ainsi qu'au modèle GPT4o-mini.
- Il obtient une haute précision sur les benchmarks de code, mathématiques, culture générale et exécution d'instructions.
Performances de préentraînement
- Mistral Small 3 est un modèle 24B qui offre les meilleures performances dans sa catégorie de taille et rivalise avec des modèles trois fois plus grands comme Llama 3.3 70B.
Cas d'usage de Mistral Small 3
- Support conversationnel à réponse rapide : il excelle dans les scénarios où des réponses rapides et précises sont essentielles.
- Appels de fonctions à faible latence : il peut gérer l'exécution rapide de fonctions dans des workflows automatisés.
- Création d'experts spécialisés : il peut être finement ajusté à un domaine spécifique pour produire des experts très précis.
- Inférence locale : utile pour les particuliers ou les organisations qui traitent des informations sensibles.
Utiliser Mistral Small 3 dans votre stack technologique préférée
- Mistral Small 3 est disponible sur la Plateforme sous
mistral-small-latest ou mistral-small-2501.
- Le modèle est proposé sur plusieurs plateformes en partenariat avec Hugging Face, Ollama, Kaggle, Together AI et Fireworks AI.
Feuille de route
- Mistral Small 3 complète les grands modèles open source de raisonnement comme DeepSeek et peut servir de base solide pour renforcer les capacités de raisonnement.
- Des modèles plus petits et plus grands seront publiés à l'avenir.
Les modèles open source de Mistral
- L'entreprise prévoit de proposer des modèles généralistes sous licence Apache 2.0.
- Les poids des modèles pourront être téléchargés et déployés en local, avec liberté de modification et d'usage.
- Ils seront également proposés via une API serverless, des déploiements on-premise et VPC, ainsi qu'une plateforme de personnalisation et d'orchestration.
1 commentaires
Avis sur Hacker News
Le modèle Mistral Small vise à être le modèle optimal pouvant tourner sur un ordinateur portable aux performances correctes, et il est comparé à Llama 3.3 70B et Qwen 2.5 32B
Tom d'Epoch AI construit une infrastructure pour réaliser des évaluations de LLM de manière systématique et à grande échelle
Le passage à la licence Apache 2.0 permet de s'éloigner d'une licence non commerciale
Après avoir testé des prompts de génération de code, les performances semblent similaires à celles de qwen2.5-coder-32b
Les points clés de cette sortie sont les suivants
Avec les récentes sorties de modèles MoE, 24GB de VRAM commencent à sembler insuffisants
Le modèle Mistral Small répond correctement à une question sur le premier album de Mary J Blige
Certains s'interrogent sur l'intérêt d'utiliser de petits modèles
Certains aimeraient que le nombre de paramètres soit inclus dans le nom du modèle