Leanstral 1.5
(docs.mistral.ai)- Leanstral 1.5 est un modèle mis à jour, conçu pour l’ingénierie de preuves formelles Lean 4, visant la démonstration automatique de théorèmes et la formalisation automatique
- La taille du modèle est de 119B paramètres au total avec 6.5B paramètres actifs, en partant du principe d’un traitement de longs contextes de preuves et de documentation
- L’identifiant fourni est
labs-leanstral-1-5, et il est présenté dans la documentation comme le modèle Labs v1.5 - La longueur de contexte est de 256k, et le tarif est indiqué à $0, ce qui met l’accent sur son accessibilité pour l’expérimentation et l’évaluation
- Il peut être utilisé avec les API Chat Completions, Function Calling, agents, sorties structurées, OCR, Document QnA, FIM, embeddings, modération, audio et traitement par lots
Un modèle adapté aux preuves formelles Lean 4
- Leanstral 1.5 est une version mise à jour du modèle d’ingénierie de preuves formelles Lean 4
- Les optimisations principales visent la démonstration automatique de théorèmes et la formalisation automatique
- L’identifiant du modèle est fourni sous la forme
labs-leanstral-1-5
Taille du modèle et propriétés de base
- La configuration des paramètres est indiquée comme 119B total parameters, 6.5B active
- La longueur de contexte est de 256k
- Le tarif est indiqué à $0
- La classification de publication est Labs v1.5
API de conversation, d’agents et de sorties structurées
- Chat Completions:
/v1/chat/completions - Function Calling:
/v1/chat/completions,/v1/conversations - Agents & Conversations:
/v1/agents,/v1/conversations - Built-In Tools:
/v1/agents,/v1/conversations - Structured Outputs:
/v1/chat/completions,/v1/conversations - Predicted Outputs:
/v1/chat/completions,/v1/conversations - Prefix:
/v1/chat/completions,/v1/conversations
Traitement de documents, complétion de code et embeddings
- OCR:
/v1/ocr - Annotations - Structured:
/v1/ocr - BBox Extraction:
/v1/ocr - Document QnA:
/v1/chat/completions,/v1/conversations - FIM:
/v1/fim/completions - Embeddings:
/v1/embeddings
Sécurité, audio et traitement par lots
- Moderations:
/v1/moderations - Chat Moderations:
/v1/chat/moderations - Transcriptions:
/v1/audio/transcriptions - Text to Speech:
/v1/audio/speech - Timestamps:
/v1/audio/transcriptions - Batching:
/v1/batch
1 commentaires
Avis sur Hacker News
Par curiosité, je me suis inscrit, j’ai mis de l’argent sur mon compte, puis j’ai essayé de l’utiliser : impossible. Comme c’était censé être un modèle Labs, j’ai voulu activer Labs, mais cette fois j’ai eu une erreur inconnue. En suivant les instructions, j’ai voulu contacter le support client, mais il n’y en a pas, seulement une FAQ bricolée
La FAQ ressemble à du vibe coding, et la recherche est tellement mauvaise que, quelle que soit la requête, elle renvoie des réponses sans aucun rapport. Et là, j’ai réalisé : si l’IA est si bonne pour le support client, pourquoi les entreprises d’IA ne fournissent-elles pas leur support client avec leur propre IA ?
[1]: https://news.ycombinator.com/item?id=43683012
Du point de vue d’une entreprise que ça agace de devoir dépenser de l’argent pour corriger de vrais problèmes, c’est donc un « bon » support client
Sur l’année écoulée, c’est déjà le quatrième message automatique de congé que je reçois de cette personne
L’échantillon ne compte que deux cas, mais ça me pousse à supposer que les entreprises françaises n’aiment pas trop être contactées en anglais
C’est un peu un autre sujet, mais c’est assez triste que l’UE n’ait rien sur le véritable marché des LLM de pointe. Surtout quand on pense au fait que les États-Unis ont récemment restreint complètement l’accès aux modèles vraiment à la pointe
Est-ce que c’était uniquement dû à un manque de financement et d’infrastructures ?
Il est plus juste de regarder ce que l’économie française peut apporter, puis de comparer aux États-Unis ou à la Chine, plutôt que de considérer ce que l’ensemble de l’économie de l’UE peut apporter aux modèles de pointe. L’échelle n’est pas la bonne. En revanche, il faut regarder ce qui peut être accompli à cette échelle plus modeste, et des produits de niche comme Leanstral ou Voxtral en sont le résultat
La France et l’Allemagne sont les deux plus grandes économies de l’UE : la France a Mistral, et l’Allemagne a un organisme à mi-chemin avec le capital-risque public. Cet organisme est très fier de mettre pas moins de 125 millions d’euros (<150 millions de dollars) pour aider des chercheurs européens à atteindre un nouveau niveau de pointe avec des modèles souverains[1]
Et cette somme ne va même pas à un seul gagnant, elle est répartie entre plusieurs bénéficiaires. Comme premier pas, c’est sympa, mais pour être exact, cela aurait été un premier pas acceptable il y a 3 ou 4 ans. C’est vraiment dommage
[1] (en allemand) https://www.sprind.org/worte/magazin/verkuendung-next-fronti...
Nous vivons dans une économie coloniale où le capital humain sert de matière première, et tout cela part vers les États-Unis. Pour y échapper, il faut cesser de jouer au jeu actuel et développer des industries compétitives avec une vraie politique industrielle, comme la Chine. Il n’y a pas eu cette volonté au cours des dernières décennies, mais Trump montre très clairement le retour de l’État, et l’Europe commence lentement à l’admettre
La difficulté, c’est de justifier financièrement le développement pur de LLM. Les modèles se ressemblent énormément. OpenAI s’est d’abord justifiée comme une « organisation caritative » dédiée à la recherche pure, et Anthropic s’est séparée en affirmant qu’OpenAI ne se préoccupait pas assez de la sécurité. Elon a dit que, s’il ne créait pas Grok, l’IA ferait semblant d’être woke et ne dirait pas la vérité, et Google a créé Gemini parce qu’ils étaient à l’origine du domaine et que la recherche en IA faisait partie de la mission centrale donnée par Larry et Sergey à la fondation de l’entreprise. Simplement, ils l’ont laissée de côté pendant un moment pour des raisons financières
Les motivations des modèles chinois sont franchement floues. Je n’ai jamais vu de bonne explication, seulement des hypothèses. Mais vu qu’ils les publient gratuitement ou à des prix excessivement bas, leurs motivations ne semblent pas non plus financières
Mistral, en revanche, est une entreprise ordinaire. Comme elle n’a pas de riche mécène prêt à y engloutir de l’argent en croyant à un récit de destin cosmique, elle doit justifier ce qu’elle fait par le retour sur investissement. Et dans ce cas, l’entraînement de LLM à grande échelle est quasiment exclu
Il faut aussi tenir compte de la réglementation de l’UE. Quand j’avais regardé, il y avait beaucoup de règles étranges qui éliminaient les perspectives de l’industrie technologique européenne. Au Royaume-Uni, il existait même une règle selon laquelle on ne pouvait crawler Internet qu’à des fins de recherche
https://knowledgerights21.org/news-story/the-uks-copyright-l...
Et sans Premier amendement, le risque d’être poursuivi pour ce qu’un modèle a dit est beaucoup plus élevé. Il suffit de voir le cas où l’Allemagne a traîné Google en justice à cause de contenu inséré par un modèle dans une page de résultats de recherche
Donc les bénéfices sont incertains et le risque juridique est très élevé
En Europe, serait-il possible de lever 100 milliards de dollars pour un nouveau labo ? Si la réponse est non, alors c’est terminé, autant abandonner
Quelle coïncidence. J’ai justement publié OpenATP ce matin. OpenATP est un package Python open source et une CLI pour les démonstrateurs automatiques de théorèmes agentiques
Il inclut aussi la prise en charge de Leanstral via le harness Vibe de Mistral. Le précédent modèle Leanstral de production a été retiré le 22 mai, et je mettrai le package à jour dès que possible pour qu’il pointe vers Leanstral 1.5
GitHub : https://github.com/henryrobbins/open-atp
Docs : https://open-atp.henryrobbins.com
Une 404 ?
https://web.archive.org/web/20260630223430/https://docs.mist...
Je ne comprends pas bien la politique sur les poids. Le site indique que les poids sont sous licence Apache, donc ça ressemble à des poids ouverts, mais je ne trouve pas de lien de téléchargement
Le profil Hugging Face semble ne proposer que d’anciens snapshots[0]. Quelqu’un sait-il si les poids peuvent être téléchargés et, si oui, où les obtenir ?
[0] https://huggingface.co/mistralai/Leanstral-2603
Moi aussi j’ai « Page not found ». Tu as réussi à y accéder ? Ça disait quoi ?
Un modèle d’ingénierie de preuves formelles Lean 4 mis à jour et optimisé pour la démonstration automatique de théorèmes et la formalisation automatique. 119B de paramètres au total, 6,5B actifs
https://web.archive.org/web/20260630223430/https://docs.mist...
Discussion sur Leanstral 1 : https://news.ycombinator.com/item?id=47404796
Lean 4 et Idris 2 sont sous-estimés et, comme ils offrent des garanties supplémentaires, ils pourraient être très adaptés au codage par les LLM
Ça renvoie une 404 maintenant
Je me suis inscrit à cause de cette annonce, mais faut-il connecter GitHub pour utiliser « Code » ? Ça paraît très restrictif