Notes sur le Mistral AI Now Summit
(koenvangilst.nl)- Mistral cherche à devenir plus qu’une simple entreprise de modèles, en se positionnant comme un acteur couvrant toute la stack IA, du compute aux modèles, à la plateforme et au conseil
- En mettant en avant son datacenter de 40 MW à Paris et des projets de datacenters supplémentaires, l’entreprise se différencie par des modèles ouverts et personnalisables que les clients peuvent posséder et exécuter on-premise
- Plus que l’annonce de nouveaux modèles, l’événement était centré sur les partenariats, avec comme points clés les collaborations avec ASML, BNP Paribas, Amazon Alexa+ et la présentation de Vibe for Work
- Dans les systèmes d’agents, le harness apporte contexte, persistance et apprentissage, tandis que le raisonnement est traité comme un élément clé pour la récupération après erreur et la transparence
- Les modèles petits et spécialisés, ainsi que le déploiement on-premise, constituent une stratégie adaptée aux secteurs réglementés et aux entreprises européennes, avec un accent mis sur le retour sur investissement concret plutôt que sur la course à l’AGI
Positionnement de Mistral
- Mistral ne se limite pas à une entreprise de modèles et évolue vers la construction d’une stack IA complète incluant le compute, les modèles, la plateforme et le conseil
- L’entreprise dispose d’un datacenter de 40 MW à Paris et prévoit également d’autres datacenters, notamment en Suède
- Ce qui la distingue d’Anthropic ou OpenAI, c’est sa capacité à proposer des modèles efficaces, ouverts et personnalisés, que les clients peuvent posséder et exécuter on-premise
- Le message de l’événement mettait davantage l’accent sur les partenariats que sur de nouveaux modèles ou des innovations techniques
- Les collaborations avec ASML, BNP Paribas et Amazon Alexa+ ont été présentées comme des exemples de résolution de problèmes concrets grâce à l’IA
- Vibe for Work a été dévoilé, présenté comme un produit similaire à Claude for Work
Stratégie produit et cas d’usage
-
Systèmes d’agents et harness
- Le modèle seul ne suffit pas, et le harness joue le rôle d’ajout de contexte, de persistance et d’apprentissage
- Le raisonnement (reasoning) est présenté comme un élément central permettant au système de revenir en arrière, de se rétablir après une erreur et de maintenir la transparence
- Les bonnes pratiques de l’organisation sont capturées sous forme de skills, qui évoluent au fil du travail avec les agents IA
-
Modèles petits et spécialisés
- Mistral présente des cas où des modèles petits, rapides et très ciblés surpassent de grands modèles généralistes en efficacité énergétique et en vitesse
- Document AI est un modèle pour l’OCR, utilisé par l’Office européen des brevets pour l’OCR à grande échelle
- Voxtral est un modèle vocal multilingue, utilisé pour alimenter Amazon Alexa+ en Europe
- Robostral est utilisé avec ASML pour la robotique industrielle
- Dans les applications orientées agents, à forte consommation de tokens, la vitesse et l’efficacité deviennent aussi importantes que les performances brutes
-
Souveraineté et déploiement on-premise
- BNP Paribas exécute des modèles Mistral on-premise en Belgique pour des usages KYC, en gardant les données sensibles à l’intérieur de la banque
- Abanca utilise l’orchestration d’agents pour traiter à grande échelle des informations sensibles de plus d’un million de clients dans son application
- Pour les entreprises européennes opérant dans des secteurs réglementés, cela peut constituer une alternative réduisant la dépendance envers les hyperscalers américains
-
Applications dans les humanités
- Une équipe de recherche de l’Austrian Academy of Sciences a fine-tuné Codestral, le LLM de code de Mistral, pour lire des fragments de papyrus vieux de plusieurs millénaires
- Ce travail contribue à rendre accessible une collection de 180 000 documents retrouvés dans le désert égyptien
- Il est présenté comme un travail qui aurait pris plus de 2 000 ans sans l’IA
- Le projet Apollo de l’Austrian Academy of Sciences montre que l’IA peut aussi contribuer aux humanités
-
Stratégie de partenaire IA européen
- La vision de Mistral est moins de gagner la course à l’AGI que de devenir un partenaire IA full-stack européen capable d’apporter dès maintenant un retour sur investissement concret
- Le succès de cette stratégie dépendra de l’adoption de l’approche Mistral par davantage d’entreprises européennes
- La combinaison de modèles ouverts, de déploiement on-premise et de partenariats enterprise pourrait séduire de nombreuses grandes organisations de l’UE
- L’époque d’une dépendance aveugle aux géants technologiques américains touche à sa fin, et l’émergence d’un acteur européen sérieux de l’IA est un point important
Vous voulez continuer à recevoir des sujets tech sélectionnés ?
Suivez le canal Telegram. @GeekNewsFR
1 commentaires
Commentaires sur Hacker News
J’apprécie vraiment Mistral et les petits modèles spécialisés par tâche, mais Mistral a pris beaucoup trop de retard depuis le troisième trimestre 2025.
Pour rester compétitif aujourd’hui, il faut pouvoir faire tourner de bons modèles de raisonnement même avec une longueur de contexte intermédiaire, et Mistral ne semble pas en être capable.
À l’heure actuelle, du côté des petits modèles, Gemma4 et Qwen3.6 sont les meilleurs, et le modèle « small » de Mistral, avec 120B de paramètres, a environ quatre fois plus de paramètres sans même réussir à rivaliser correctement avec des modèles quatre fois plus petits.
Il y a un an, à l’époque de Mistral Small 3.1, ils restaient dans la course, mais aujourd’hui leur présence est presque effacée.
Si Mistral vise sérieusement le marché de l’on-premise et des petits modèles spécialisés par tâche, produire un modèle qui enthousiasme les gens de r/localLlama pourrait être un assez bon indicateur indirect.
Le fait qu’ils aient si peu parlé de nouveaux modèles pendant la conférence m’inquiète aussi. À titre personnel, je pense que c’est précisément là qu’ils devraient concentrer leurs efforts.
Je me demande ce qui les bloque : l’argent, les ressources de calcul, les compétences, les données d’entraînement ? Je n’en sais rien.
Pour construire un très bon modèle, il faut peut-être l’entraîner sur des données assez douteuses, comme les sorties des modèles de pointe, et j’ai peur que Mistral soit trop européen et trop orienté clients entreprises pour prendre ce genre de risque.
J’ai l’impression que ça finira en entreprise zombie, comme Dailymotion.
Je pense par exemple à un modèle utilisé par défaut dans Claude Code, sorte de sous-ensemble d’Opus dédié au logiciel.
Ce serait plus petit, moins cher à déployer et à utiliser, et peut-être même plus rapide.
Mistral devra être prêt à ce moment-là, mais au vu de ses résultats récents, il est difficile d’être très optimiste.
Même si Mistral 4 n’a que 6B de paramètres actifs par token et qu’on peut mettre 3 à 3,5 paramètres par token sur une 4090, environ 240GB à télécharger et à stocker, c’est quasiment la limite pour tester en local.
C’est encore plus vrai si on télécharge et évalue plusieurs modèles, et cela rend aussi plus difficile la création de fine-tunings dérivés par d’autres personnes, comme avec les anciens modèles Mistral/Magistral.
J’ai assisté à l’intervention d’un excellent responsable IT dans l’administration, qui évaluait des modèles et se montrait très insatisfait de la situation actuelle.
Il veut utiliser Mistral, et dans certains cas c’est même le seul modèle basé dans l’UE qu’il puisse utiliser, mais il sait aussi que les performances sont vraiment mauvaises et que le retard se creuse.
Mistral arrivera peut-être malgré tout à bâtir une activité rentable simplement parce que, pour certains usages dans l’UE, c’est le seul modèle possible. C’est triste, et pénible à voir.
J’aimerais vraiment que l’Europe participe au développement et à la recherche en IA, et j’ai longtemps beaucoup soutenu Mistral.
Mais l’écart technologique se creuse énormément. S’ils n’arrivent pas à corriger ça, ce sera une preuve de plus que l’Europe ne sait pas faire fonctionner de grandes entreprises tech avec de bons résultats.
Dans les faits, presque tous les laboratoires chinois font nettement mieux. Sans même parler de DeepSeek, ce n’est pas Mistral qui a produit des choses comme MiMo 2.5 ou Minimax 2.7.
Les modèles de Mistral sont soit plus faibles, soit plus gros et plus lents, soit dépourvus de mélange d’experts (MoE), donc ils ne sont pas bons.
L’Europe s’est tiré une balle dans le pied avec cette loi bricolée dans l’urgence au plus fort de l’hystérie populaire, et désormais aucune entreprise sensée ne voudra y construire quoi que ce soit.
Aux États-Unis ou en Chine, une startup IA peut démarrer avec un gamin et un ordinateur ; en Europe, ce gamin a besoin de douze avocats.
Si Mistral a perdu toute visibilité malgré son avance initiale, ses premiers modèles très prometteurs et les investissements reçus, c’est peut-être le résultat de tous ses efforts pour respecter cette réglementation.
J’avais été très impressionné par son rapport technique. Bien sûr, si je comprends bien, l’idée du MoE existait déjà.
S’ils avaient davantage poussé la famille de modèles Mixtral, ils auraient peut-être aujourd’hui une réputation comparable à celle de la gamme Qwen. C’est une occasion manquée.
Comparativement, je trouve que l’Europe s’en sort plutôt bien.
BNP Paribas fait tourner les modèles de Mistral on-premise en Belgique pour le KYC, et le fait que les données sensibles restent à l’intérieur de la banque est important.
Abanca utilise aussi une orchestration d’agents pour traiter des informations clients sensibles à grande échelle, comme les 2 millions de clients de son application.
Pour les entreprises européennes des secteurs régulés, c’est une meilleure alternative que de dépendre des hyperscalers américains, et le fait que Mistral se concentre sur l’on-premise et les modèles hébergés en Europe est une orientation très intelligente.
Tout le monde fait du full-deployment engineering ou du customer-specific engineering, sinon on a juste l’air d’une entreprise qui ajoute sa marge au coût des tokens.
Dans ce cas, ce sont les boîtes de Neo-SaaS qui capteront l’argent. Sinon, qui achèterait l’IA de Mistral, et quelles autres options y aurait-il ?
À la place, ils semblent se focaliser sur d’autres domaines comme les modèles multilingues, l’OCR et la voix.
Leur page de présentation des modèles le montre aussi, mais c’est tellement varié, avec trop de catégories et trop de noms de modèles, que je m’y perds toujours.
J’espère que leurs décisions porteront leurs fruits.
Pour les startups européennes, le B2B entreprise m’a toujours semblé être l’endroit où l’on va mourir.
J’ai assisté à l’événement, et l’ampleur de la participation était impressionnante, avec tous les dirigeants des grandes entreprises cotées européennes présents.
Le grand nombre de partenaires invités était aussi intéressant. Il y avait de tout, de Microsoft, Accenture et EY jusqu’à des startups comme alpic.ai ou lingo.dev.
Ils semblent aussi renforcer leur activité côté M&A.
Indépendamment du business, le design du site web est vraiment excellent : https://mistral.ai/
J’ai reçu un email de Mistral disant qu’ils allaient supprimer progressivement d’ici août certains modèles dédiés, peut-être la plupart, comme devstral, et qu’il fallait désormais utiliser les modèles généralistes.
Le coût augmente de façon exponentielle.
Il est indiqué qu’ils recommandent de passer de Devstral 2 (devstral-2512 et devstral-latest) à un modèle plus puissant, Mistral Medium 3.5 (mistral-medium-3-5, avec
reasoning_effortréglé sur "high"), au prix de $1.5/$7.5 par million de tokens en entrée/sortie.Auparavant, c’était $0.4/$2.
Quoi qu’il en soit, après avoir reçu l’email, j’ai espéré que ce soit le signe qu’ils comptent sortir de nouveaux modèles améliorés dans les prochains mois.
Il ne semble y avoir absolument aucun moat. On dirait une société de conseil logiciel avec des datacenters.
En plus, le texte dit que beaucoup de clients utilisent ces modèles en on-premise, donc les datacenters ne sont même pas vraiment un avantage.
Qu’est-ce qui empêcherait n’importe quelle startup subventionnée par l’État de fine-tuner un petit modèle open source ?
Je ne dis pas que c’est vrai, seulement que cette hypothèse est possible.
En tant qu’Européen, je suis d’accord à 100x.
Parmi tous ces acteurs, j’aime vraiment la direction et la transparence de Mistral.
Abanca dit utiliser une orchestration d’agents pour traiter les informations clients sensibles à une « échelle énorme » avec les 2 millions de clients de son application, mais je ne sais pas si c’est mon idée de ce qu’est une énorme échelle qui est biaisée.
2 millions d’utilisateurs, ça représente quoi, quelques centaines de Mo de données ? Peut-être quelques Go au plus même avec beaucoup de données par utilisateur.
D’après ce que j’ai compris de la présentation, ils ont probablement utilisé des agents à responsabilité limitée et sans doute des modèles plus petits pour obtenir des réponses rapides, fiables et pas trop coûteuses.
En revanche, ce type d’activité peut être assez défendable, mais cela ne se traduit généralement pas par une rentabilité aussi élevée.