1 points par GN⁺ 5 시간 전 | 1 commentaires | Partager sur WhatsApp
  • Mistral cherche à devenir plus qu’une simple entreprise de modèles, en se positionnant comme un acteur couvrant toute la stack IA, du compute aux modèles, à la plateforme et au conseil
  • En mettant en avant son datacenter de 40 MW à Paris et des projets de datacenters supplémentaires, l’entreprise se différencie par des modèles ouverts et personnalisables que les clients peuvent posséder et exécuter on-premise
  • Plus que l’annonce de nouveaux modèles, l’événement était centré sur les partenariats, avec comme points clés les collaborations avec ASML, BNP Paribas, Amazon Alexa+ et la présentation de Vibe for Work
  • Dans les systèmes d’agents, le harness apporte contexte, persistance et apprentissage, tandis que le raisonnement est traité comme un élément clé pour la récupération après erreur et la transparence
  • Les modèles petits et spécialisés, ainsi que le déploiement on-premise, constituent une stratégie adaptée aux secteurs réglementés et aux entreprises européennes, avec un accent mis sur le retour sur investissement concret plutôt que sur la course à l’AGI

Positionnement de Mistral

  • Mistral ne se limite pas à une entreprise de modèles et évolue vers la construction d’une stack IA complète incluant le compute, les modèles, la plateforme et le conseil
  • L’entreprise dispose d’un datacenter de 40 MW à Paris et prévoit également d’autres datacenters, notamment en Suède
  • Ce qui la distingue d’Anthropic ou OpenAI, c’est sa capacité à proposer des modèles efficaces, ouverts et personnalisés, que les clients peuvent posséder et exécuter on-premise
  • Le message de l’événement mettait davantage l’accent sur les partenariats que sur de nouveaux modèles ou des innovations techniques
    • Les collaborations avec ASML, BNP Paribas et Amazon Alexa+ ont été présentées comme des exemples de résolution de problèmes concrets grâce à l’IA
    • Vibe for Work a été dévoilé, présenté comme un produit similaire à Claude for Work

Stratégie produit et cas d’usage

  • Systèmes d’agents et harness

    • Le modèle seul ne suffit pas, et le harness joue le rôle d’ajout de contexte, de persistance et d’apprentissage
    • Le raisonnement (reasoning) est présenté comme un élément central permettant au système de revenir en arrière, de se rétablir après une erreur et de maintenir la transparence
    • Les bonnes pratiques de l’organisation sont capturées sous forme de skills, qui évoluent au fil du travail avec les agents IA
  • Modèles petits et spécialisés

    • Mistral présente des cas où des modèles petits, rapides et très ciblés surpassent de grands modèles généralistes en efficacité énergétique et en vitesse
    • Document AI est un modèle pour l’OCR, utilisé par l’Office européen des brevets pour l’OCR à grande échelle
    • Voxtral est un modèle vocal multilingue, utilisé pour alimenter Amazon Alexa+ en Europe
    • Robostral est utilisé avec ASML pour la robotique industrielle
    • Dans les applications orientées agents, à forte consommation de tokens, la vitesse et l’efficacité deviennent aussi importantes que les performances brutes
  • Souveraineté et déploiement on-premise

    • BNP Paribas exécute des modèles Mistral on-premise en Belgique pour des usages KYC, en gardant les données sensibles à l’intérieur de la banque
    • Abanca utilise l’orchestration d’agents pour traiter à grande échelle des informations sensibles de plus d’un million de clients dans son application
    • Pour les entreprises européennes opérant dans des secteurs réglementés, cela peut constituer une alternative réduisant la dépendance envers les hyperscalers américains
  • Applications dans les humanités

    • Une équipe de recherche de l’Austrian Academy of Sciences a fine-tuné Codestral, le LLM de code de Mistral, pour lire des fragments de papyrus vieux de plusieurs millénaires
    • Ce travail contribue à rendre accessible une collection de 180 000 documents retrouvés dans le désert égyptien
    • Il est présenté comme un travail qui aurait pris plus de 2 000 ans sans l’IA
    • Le projet Apollo de l’Austrian Academy of Sciences montre que l’IA peut aussi contribuer aux humanités
  • Stratégie de partenaire IA européen

    • La vision de Mistral est moins de gagner la course à l’AGI que de devenir un partenaire IA full-stack européen capable d’apporter dès maintenant un retour sur investissement concret
    • Le succès de cette stratégie dépendra de l’adoption de l’approche Mistral par davantage d’entreprises européennes
    • La combinaison de modèles ouverts, de déploiement on-premise et de partenariats enterprise pourrait séduire de nombreuses grandes organisations de l’UE
    • L’époque d’une dépendance aveugle aux géants technologiques américains touche à sa fin, et l’émergence d’un acteur européen sérieux de l’IA est un point important

1 commentaires

 
GN⁺ 5 시간 전
Commentaires sur Hacker News
  • J’apprécie vraiment Mistral et les petits modèles spécialisés par tâche, mais Mistral a pris beaucoup trop de retard depuis le troisième trimestre 2025.
    Pour rester compétitif aujourd’hui, il faut pouvoir faire tourner de bons modèles de raisonnement même avec une longueur de contexte intermédiaire, et Mistral ne semble pas en être capable.
    À l’heure actuelle, du côté des petits modèles, Gemma4 et Qwen3.6 sont les meilleurs, et le modèle « small » de Mistral, avec 120B de paramètres, a environ quatre fois plus de paramètres sans même réussir à rivaliser correctement avec des modèles quatre fois plus petits.
    Il y a un an, à l’époque de Mistral Small 3.1, ils restaient dans la course, mais aujourd’hui leur présence est presque effacée.
    Si Mistral vise sérieusement le marché de l’on-premise et des petits modèles spécialisés par tâche, produire un modèle qui enthousiasme les gens de r/localLlama pourrait être un assez bon indicateur indirect.

    • D’accord. Je suis abonné payant à Le Chat Pro et je soutiens vraiment une alternative européenne, mais l’écart de qualité entre Mistral et les labos de pointe devient trop important pour être ignoré.
      Le fait qu’ils aient si peu parlé de nouveaux modèles pendant la conférence m’inquiète aussi. À titre personnel, je pense que c’est précisément là qu’ils devraient concentrer leurs efforts.
      Je me demande ce qui les bloque : l’argent, les ressources de calcul, les compétences, les données d’entraînement ? Je n’en sais rien.
      Pour construire un très bon modèle, il faut peut-être l’entraîner sur des données assez douteuses, comme les sorties des modèles de pointe, et j’ai peur que Mistral soit trop européen et trop orienté clients entreprises pour prendre ce genre de risque.
    • Mistral semble être entré dans la phase tirer le maximum d’argent du contribuable de l’UE que connaissent les entreprises technologiques européennes qui ne se font pas racheter par des groupes américains.
      J’ai l’impression que ça finira en entreprise zombie, comme Dailymotion.
    • C’est légèrement à côté du sujet des petits modèles spécialisés par tâche, mais comme je ne m’y connais pas très bien, je me demande s’il y a une raison fondamentale pour laquelle les fournisseurs de modèles de pointe ne sortent pas des modèles plus petits et plus ciblés.
      Je pense par exemple à un modèle utilisé par défaut dans Claude Code, sorte de sous-ensemble d’Opus dédié au logiciel.
      Ce serait plus petit, moins cher à déployer et à utiliser, et peut-être même plus rapide.
    • D’accord. Quand les labos de pointe feront leur prochaine hausse de prix et réduiront inévitablement les limites des abonnements, les gens reconsidéreront beaucoup plus sérieusement les fournisseurs de modèles.
      Mistral devra être prêt à ce moment-là, mais au vu de ses résultats récents, il est difficile d’être très optimiste.
    • Je fais tourner des LLM en local, et personnellement 22B~32B est la taille maximale que je suis prêt à essayer.
      Même si Mistral 4 n’a que 6B de paramètres actifs par token et qu’on peut mettre 3 à 3,5 paramètres par token sur une 4090, environ 240GB à télécharger et à stocker, c’est quasiment la limite pour tester en local.
      C’est encore plus vrai si on télécharge et évalue plusieurs modèles, et cela rend aussi plus difficile la création de fine-tunings dérivés par d’autres personnes, comme avec les anciens modèles Mistral/Magistral.
  • J’ai assisté à l’intervention d’un excellent responsable IT dans l’administration, qui évaluait des modèles et se montrait très insatisfait de la situation actuelle.
    Il veut utiliser Mistral, et dans certains cas c’est même le seul modèle basé dans l’UE qu’il puisse utiliser, mais il sait aussi que les performances sont vraiment mauvaises et que le retard se creuse.
    Mistral arrivera peut-être malgré tout à bâtir une activité rentable simplement parce que, pour certains usages dans l’UE, c’est le seul modèle possible. C’est triste, et pénible à voir.

  • J’aimerais vraiment que l’Europe participe au développement et à la recherche en IA, et j’ai longtemps beaucoup soutenu Mistral.
    Mais l’écart technologique se creuse énormément. S’ils n’arrivent pas à corriger ça, ce sera une preuve de plus que l’Europe ne sait pas faire fonctionner de grandes entreprises tech avec de bons résultats.
    Dans les faits, presque tous les laboratoires chinois font nettement mieux. Sans même parler de DeepSeek, ce n’est pas Mistral qui a produit des choses comme MiMo 2.5 ou Minimax 2.7.
    Les modèles de Mistral sont soit plus faibles, soit plus gros et plus lents, soit dépourvus de mélange d’experts (MoE), donc ils ne sont pas bons.

    • https://en.wikipedia.org/wiki/Artificial_Intelligence_Act#Pe...
      L’Europe s’est tiré une balle dans le pied avec cette loi bricolée dans l’urgence au plus fort de l’hystérie populaire, et désormais aucune entreprise sensée ne voudra y construire quoi que ce soit.
      Aux États-Unis ou en Chine, une startup IA peut démarrer avec un gamin et un ordinateur ; en Europe, ce gamin a besoin de douze avocats.
      Si Mistral a perdu toute visibilité malgré son avance initiale, ses premiers modèles très prometteurs et les investissements reçus, c’est peut-être le résultat de tous ses efforts pour respecter cette réglementation.
    • Je ne comprends pas ce que signifie exactement le fait que l’écart technologique se creuse autant. N’est-il pas plus facile et moins coûteux de rattraper les leaders que d’ouvrir la voie ?
    • Concernant le mélange d’experts (MoE), je me souviens de Mixtral comme du modèle qui a montré pour la première fois l’utilité pratique du MoE.
      J’avais été très impressionné par son rapport technique. Bien sûr, si je comprends bien, l’idée du MoE existait déjà.
      S’ils avaient davantage poussé la famille de modèles Mixtral, ils auraient peut-être aujourd’hui une réputation comparable à celle de la gamme Qwen. C’est une occasion manquée.
    • Le gouvernement britannique a récemment annoncé investir 10 millions de livres dans la recherche en IA, mais les consultants en capteront probablement l’essentiel.
      Comparativement, je trouve que l’Europe s’en sort plutôt bien.
  • BNP Paribas fait tourner les modèles de Mistral on-premise en Belgique pour le KYC, et le fait que les données sensibles restent à l’intérieur de la banque est important.
    Abanca utilise aussi une orchestration d’agents pour traiter des informations clients sensibles à grande échelle, comme les 2 millions de clients de son application.
    Pour les entreprises européennes des secteurs régulés, c’est une meilleure alternative que de dépendre des hyperscalers américains, et le fait que Mistral se concentre sur l’on-premise et les modèles hébergés en Europe est une orientation très intelligente.

    • Pour le dire poliment, je ne dirais pas que c’est très intelligent. C’est juste une option correcte dans une situation où les choix sont limités.
      Tout le monde fait du full-deployment engineering ou du customer-specific engineering, sinon on a juste l’air d’une entreprise qui ajoute sa marge au coût des tokens.
      Dans ce cas, ce sont les boîtes de Neo-SaaS qui capteront l’argent. Sinon, qui achèterait l’IA de Mistral, et quelles autres options y aurait-il ?
    • Le fait que Mistral ait renforcé son expertise en déploiement à grande échelle avec l’acquisition de Koyeb était aussi un choix parfaitement cohérent.
    • Je pense que Mistral ne se concentre pas sur la génération de contenu comme le code, les images ou la vidéo.
      À la place, ils semblent se focaliser sur d’autres domaines comme les modèles multilingues, l’OCR et la voix.
      Leur page de présentation des modèles le montre aussi, mais c’est tellement varié, avec trop de catégories et trop de noms de modèles, que je m’y perds toujours.
      J’espère que leurs décisions porteront leurs fruits.
    • N’est-ce pas la trajectoire classique des startups de l’UE après avoir renoncé au B2C ou au marché SaaS mondial : se recentrer sur les grands comptes B2B européens et les contrats publics ?
      Pour les startups européennes, le B2B entreprise m’a toujours semblé être l’endroit où l’on va mourir.
    • Cela dit, quelle raison y a-t-il d’utiliser Mistral en on-premise ? Pourquoi pas Qwen à la place ?
  • J’ai assisté à l’événement, et l’ampleur de la participation était impressionnante, avec tous les dirigeants des grandes entreprises cotées européennes présents.
    Le grand nombre de partenaires invités était aussi intéressant. Il y avait de tout, de Microsoft, Accenture et EY jusqu’à des startups comme alpic.ai ou lingo.dev.
    Ils semblent aussi renforcer leur activité côté M&A.

  • Indépendamment du business, le design du site web est vraiment excellent : https://mistral.ai/

    • Ça a l’air trop complexe, et la mise en page des paragraphes semble bancale.
    • Je ne vois pas précisément ce qu’il y a de bien. J’ai fait défiler sur téléphone et ça ressemble à un site corporate assez banal.
    • J’aime toute l’identité de marque de Mistral.
  • J’ai reçu un email de Mistral disant qu’ils allaient supprimer progressivement d’ici août certains modèles dédiés, peut-être la plupart, comme devstral, et qu’il fallait désormais utiliser les modèles généralistes.
    Le coût augmente de façon exponentielle.
    Il est indiqué qu’ils recommandent de passer de Devstral 2 (devstral-2512 et devstral-latest) à un modèle plus puissant, Mistral Medium 3.5 (mistral-medium-3-5, avec reasoning_effort réglé sur "high"), au prix de $1.5/$7.5 par million de tokens en entrée/sortie.
    Auparavant, c’était $0.4/$2.

    • J’ai reçu le même email, mais je pensais avoir déjà tout migré vers Mistral-Medium-3.5, donc je ne sais pas très bien quel modèle en fin de vie j’utilisais encore.
      Quoi qu’il en soit, après avoir reçu l’email, j’ai espéré que ce soit le signe qu’ils comptent sortir de nouveaux modèles améliorés dans les prochains mois.
  • Il ne semble y avoir absolument aucun moat. On dirait une société de conseil logiciel avec des datacenters.
    En plus, le texte dit que beaucoup de clients utilisent ces modèles en on-premise, donc les datacenters ne sont même pas vraiment un avantage.
    Qu’est-ce qui empêcherait n’importe quelle startup subventionnée par l’État de fine-tuner un petit modèle open source ?

    • C’est peut-être parce qu’en distillant un petit modèle à partir d’un plus grand modèle que l’on contrôle directement, on peut obtenir un meilleur petit modèle qu’en fine-tunant à partir d’un plus grand modèle que l’on ne contrôle pas.
      Je ne dis pas que c’est vrai, seulement que cette hypothèse est possible.
  • En tant qu’Européen, je suis d’accord à 100x.
    Parmi tous ces acteurs, j’aime vraiment la direction et la transparence de Mistral.

    • Même sans être Européen, c’est une bonne chose de voir un concurrent européen face aux modèles américains et chinois.
  • Abanca dit utiliser une orchestration d’agents pour traiter les informations clients sensibles à une « échelle énorme » avec les 2 millions de clients de son application, mais je ne sais pas si c’est mon idée de ce qu’est une énorme échelle qui est biaisée.
    2 millions d’utilisateurs, ça représente quoi, quelques centaines de Mo de données ? Peut-être quelques Go au plus même avec beaucoup de données par utilisateur.

    • Peut-être, mais si l’on résout les demandes du support client en mode agentique avec les grands modèles de langage récents, on consomme vite beaucoup de tokens.
      D’après ce que j’ai compris de la présentation, ils ont probablement utilisé des agents à responsabilité limitée et sans doute des modèles plus petits pour obtenir des réponses rapides, fiables et pas trop coûteuses.
    • Les entreprises grand public européennes ont plus de mal à scaler facilement que les entreprises américaines, et c’est une grande partie de la raison pour laquelle l’Europe a, de manière générale, du mal à faire émerger des entreprises technologiques de grande taille.
      En revanche, ce type d’activité peut être assez défendable, mais cela ne se traduit généralement pas par une rentabilité aussi élevée.