Présentation du modèle Mistral Large

(mistral.ai)

8 points par GN⁺ 2024-02-27 | 1 commentaires | Partager sur WhatsApp

Mistral Large est un modèle de génération de texte de pointe, doté de capacités de raisonnement de tout premier plan
Il peut effectuer des tâches de raisonnement complexes dans plusieurs langues, et peut être utilisé pour la compréhension, la transformation de texte et la génération de code
Il affiche de solides performances sur le benchmark MMLU et est le deuxième modèle le mieux classé au monde parmi ceux généralement disponibles via API
- 81,2 % juste derrière GPT-4 à 86,4 %, tandis que Claude 2 est à 78,5 % et Gemini Pro à 71,8 %

Nouvelles fonctionnalités et points forts de Mistral Large

Il maîtrise l’anglais, le français, l’espagnol, l’allemand et l’italien à un niveau natif, avec une compréhension fine de la grammaire et du contexte culturel
Sa fenêtre de contexte de 32K tokens permet un rappel précis de l’information dans de grands documents
Grâce à son suivi précis des instructions, les développeurs peuvent concevoir leurs propres politiques de modération, ce qui est utilisé pour les réglages de modération au niveau système de le Chat
Les appels de fonctions sont intégrés, ce qui, avec le mode de sortie restreinte implémenté sur la Plateforme, permet le développement d’applications et la modernisation de la stack technique à grande échelle

Modèle disponible sur Azure grâce au partenariat avec Microsoft

L’objectif de Mistral est de démocratiser une IA de pointe, et pour cela l’entreprise propose des modèles open et commerciaux sur Azure
Les modèles de Mistral sont disponibles via La Plateforme et Azure, et peuvent aussi être déployés directement dans l’environnement des utilisateurs
La Plateforme est hébergée de façon sécurisée sur l’infrastructure européenne de Mistral, tandis qu’Azure les propose via Azure AI Studio et Azure Machine Learning
Le déploiement autonome permet d’accéder aux poids du modèle pour les cas d’usage les plus sensibles, et il est possible de consulter des retours d’expérience et de contacter l’équipe pour plus d’informations

Capacités de Mistral Large

Mistral Large montre de solides capacités de raisonnement face aux principaux modèles de LLM sur les benchmarks standards
En multilingue également, Mistral Large surpasse nettement LLaMA 2 70B en français, allemand, espagnol et italien
Il affiche aussi des performances de tout premier plan sur les tâches de code et de mathématiques

Nouveau Mistral Small, optimisé pour les charges de travail à faible latence

En plus de Mistral Large, sortie d’un nouveau modèle, Mistral Small, optimisé pour la latence et les coûts
Mistral Small offre de meilleures performances que Mixtral 8x7B avec une latence plus faible, constituant une solution intermédiaire affinée entre l’offre open-weight et les modèles flagship
Mistral Small bénéficie des mêmes innovations d’activation RAG et d’appels de fonctions que Mistral Large
Il propose des endpoints open-weight à prix compétitif ainsi que de nouveaux endpoints de modèles optimisés, offrant une vue complète des arbitrages performance/coût

Format JSON et appels de fonctions

Le mode format JSON force la sortie du modèle de langage à être un JSON valide
Avec les appels de fonctions, les développeurs peuvent relier leurs propres outils aux endpoints Mistral pour permettre des interactions plus complexes avec du code interne, des API ou des bases de données
Les appels de fonctions et le format JSON ne sont disponibles que sur mistral-small et mistral-large, et la prise en charge du formatage pour tous les endpoints sera bientôt ajoutée

L’avis de GN⁺

Mistral Large est un modèle de langage d’IA doté d’un support multilingue et de capacités avancées de raisonnement ; sa capacité à exécuter des tâches complexes dans diverses langues est particulièrement remarquable.
Ce modèle a le potentiel de rivaliser avec des modèles existants comme GPT-4, et son support de nombreuses langues renforce particulièrement sa pertinence pour le marché mondial.
Le partenariat avec Azure donne aux modèles de Mistral AI l’opportunité d’atteindre une base d’utilisateurs plus large, tout en renforçant l’évolutivité et l’accessibilité des services d’IA dans le cloud.
Le lancement de modèles optimisés comme Mistral Small peut représenter une option attrayante pour les entreprises qui ont besoin de solutions d’IA rentables et à faible latence.
Le format JSON et les appels de fonctions permettent aux développeurs d’intégrer plus facilement les modèles d’IA dans leurs applications, ce qui améliore la praticité et la flexibilité de la technologie IA.

1 commentaires

GN⁺ 2024-02-27

Avis Hacker News

L'honnêteté des documents marketing est très appréciée. Montrer des scores de benchmark inférieurs à ceux du leader du marché semble préférable à l'utilisation sélective des benchmarks par Google.
Ils ont déjà accompli beaucoup de choses, mais certains auraient aimé y voir une réaffirmation de leur promesse de contribuer à la communauté open source. C'était perçu comme un élément important de leur marque.
Depuis l'affaire miqu, certains s'attendaient à voir davantage d'open weights, mais il faudra sans doute attendre pour voir le résultat.
Mise à jour des changements : renommage des noms d'endpoint API et ajout d'endpoints de modèles, sortie de nouveaux modèles, mise à jour des modèles existants et annonce de leur future suppression.
Nouvelles fonctionnalités API : function calling et mode JSON désormais disponibles sur les modèles Mistral Small et Mistral Large.
La Plateforme : ajout d'un système de paiement prenant en charge plusieurs devises et introduction de fonctionnalités de plateforme pour les entreprises.
Le Chat : lancement d'une nouvelle interface de chat permettant d'interagir facilement avec les modèles Mistral.
Les nouveaux modèles ont été ajoutés au plugin de l'outil LLM CLI. On peut maintenant les utiliser comme suit.
J'ai utilisé Le Chat pour résoudre quelques problèmes de code aujourd'hui, et il a fourni des réponses bien meilleures que ChatGPT, y compris GPT-4. Je ne sais pas si, comme certains le suggèrent, la qualité de ChatGPT a baissé pour réduire les coûts, mais sur ces quelques problèmes, la qualité des réponses de Mistral était nettement supérieure.
Je ne connaissais pas l'existence de Le Chat. Je voulais un concurrent à ChatGPT utilisant Mistral, et j'aime aussi le fait qu'ils aient ajouté « le » devant le nom du produit.
Sur Azure, Mistral est légèrement moins cher que GPT-4.
Certains se demandent si tout le battage autour des open weights est déjà terminé et si tout va continuer à rester fermé.
Il n'y a d'information nulle part sur la taille en paramètres, ce qui fait se demander si c'est intentionnel ou si cela a simplement été oublié.
C'est un peu comme l'existence de plusieurs architectures CPU interchangeables. À chaque sortie d'un nouveau LLM, on a l'impression que le monopole recule un peu plus, ce qui donne de l'espoir. Même sans modèles open source, OpenAI semble déjà avoir accompli sa mission.

Présentation du modèle Mistral Large

Nouvelles fonctionnalités et points forts de Mistral Large

Modèle disponible sur Azure grâce au partenariat avec Microsoft

Capacités de Mistral Large

Nouveau Mistral Small, optimisé pour les charges de travail à faible latence

Format JSON et appels de fonctions

L’avis de GN⁺

À lire aussi

1 commentaires

Avis Hacker News