- Magistral est le premier modèle de raisonnement publié par Mistral AI, spécialisé dans le raisonnement adapté à des domaines spécifiques, la transparence et le raisonnement multilingue
- Lancé en deux versions : Magistral Small (24B paramètres) en open source et Magistral Medium, version enterprise
- Fournit de manière transparente un raisonnement multilingue fondé sur la chaîne de pensée (Chain of Thought), avec un processus logique étape par étape dans la langue de l’utilisateur
- Sur AIME2024, Magistral Medium atteint 73,6 % (jusqu’à 90 %), et Small 70,7 % (jusqu’à 83,3 %)
- Prend en charge un déroulé logique précis, étape par étape ainsi qu’une vitesse de réponse 10 fois plus rapide pour des secteurs et usages variés, notamment les industries réglementées comme le juridique, la finance et la santé, ainsi que le data engineering, le développement logiciel et les contenus créatifs
Magistral — annonce du premier modèle de raisonnement de Mistral AI
- Magistral est un modèle de reasoning axé sur la résolution de problèmes concrets et l’amélioration fondée sur le feedback
- Magistral Small est la version open source à 24B paramètres, tandis que Magistral Medium est une version enterprise plus puissante, publiée en parallèle
- Indicateurs de performance :
- Magistral Medium : 73,6 % sur AIME2024, jusqu’à 90 % avec vote majoritaire
- Magistral Small : respectivement 70,7 % et 83,3 %
- Application d’un raisonnement Chain of Thought basé sur les langues et écritures du monde entier, permettant un déroulé de pensée de niveau langue maternelle
- Adapté à divers types de tâches comme le calcul structuré, la logique de programmation, les arbres de décision et les systèmes fondés sur des règles
- Les fonctions Think mode et Flash Answers de Le Chat améliorent la vitesse de réponse jusqu’à 10 fois par rapport à la concurrence
- Le papier officiel inclut une évaluation complète des algorithmes, de l’infrastructure d’entraînement, des techniques de reinforcement learning et des enseignements tirés de l’entraînement
Détails sur le modèle et la technologie
- Processus de raisonnement transparent :
- Magistral est optimisé pour une logique en plusieurs étapes, permettant à l’utilisateur de consulter et suivre le processus de raisonnement dans sa propre langue
- Contrairement aux modèles généralistes, il renforce l’interprétabilité et les capacités de vérification
- Objectif : mises à jour continues du modèle et améliorations rapides
- Raisonnement multilingue : forte précision et maintien de la logique en anglais, français, espagnol, allemand, italien, arabe, russe, chinois, etc.
- Vitesse de réponse :
- Grâce à la fonction Flash Answers de Le Chat, Magistral Medium prend en charge le raisonnement en temps réel et le feedback avec une vitesse de traitement des tokens 10 fois supérieure à celle des concurrents
- Démonstration d’une supériorité marquée en vitesse face aux grands modèles concurrents comme ChatGPT
Open source et participation de la communauté
- Magistral Small est publié sous licence Apache 2.0
- Les utilisateurs peuvent analyser, modifier et reconfigurer directement sa structure et sa méthode de raisonnement
- Les précédents modèles open source ont été utilisés dans des projets de recherche innovants comme ether0 et DeepHermes 3
Cas d’usage étendus
- Magistral est optimisé pour les domaines où le raisonnement précis étape par étape et la transparence sont essentiels, comme le droit, la finance, le développement logiciel et le storytelling
-
Stratégie et opérations d’entreprise
- Peut prendre en charge la planification stratégique, l’évaluation des risques, la prise de décision fondée sur les données et le calcul de solutions optimales sous contraintes complexes
-
Industries réglementées et secteur public
- Les professionnels du droit, de la finance, de la santé et des administrations peuvent suivre les chemins de raisonnement logique et assurer l’auditabilité
- Aide à satisfaire les exigences d’auditabilité et de conformité réglementaire
-
Systèmes, logiciel et data engineering
- Améliore la qualité du support en programmation, conception de projets, architecture backend et data engineering par rapport aux LLM non orientés raisonnement
- Efficace pour les tâches en plusieurs étapes impliquant des outils externes ou des intégrations API
-
Génération de contenu et communication
- Magistral obtient aussi d’excellents résultats en écriture créative et en storytelling
- Il peut produire non seulement des textes cohérents, mais aussi des idées originales et inventives
Méthodes d’utilisation et canaux de déploiement
- La version Small peut être téléchargée puis déployée en autonomie
- La version Medium est disponible immédiatement sur Le Chat (web), API et Amazon SageMaker
- Une prise en charge supplémentaire est prévue prochainement sur IBM WatsonX, Azure AI et Google Cloud Marketplace
- Pour une intégration sur mesure en entreprise ou un déploiement on-premise, contact séparé requis
1 commentaires
Commentaires Hacker News
ollama run hf.co/unsloth/Magistral-Small-2506-GGUF:UD-Q4_K_XL, et il est fortement recommandé d’utiliser dans llama.cpp des options comme--jinja,--temp 0.7,--top-p 0.95. Il est aussi conseillé d’augmenter la longueur de contexte d’Ollama à 8192 ou plus, et des indications supplémentaires sont disponibles dans la documentation officiellejinja-puis espace le transforme souvent en tiret demi-cadratin, et qu’il corrige volontairement cela pour éviter d’être mal jugé