- Modèle de langage Mamba2 spécialisé dans la génération de code
- Les modèles Mamba, contrairement aux modèles Transformer, offrent une inférence en temps linéaire et la capacité de modéliser des séquences de longueur théoriquement infinie
- Des réponses rapides quelle que soit la longueur d’entrée permettent aux utilisateurs d’interagir largement avec le modèle
- Cette efficacité a un impact particulier sur la productivité de codage, au point d’atteindre des performances comparables à celles des modèles SOTA basés sur des Transformers
- Dans les benchmarks, pour les modèles 7B, Codestral Mamba (7B) montre des capacités supérieures ou presque équivalentes à celles de CodeGemma-1.1 7B, CodeLlama 7B et DeepSeek v1.5 7B
- Il devrait devenir un excellent assistant de code en local
- Déployable via le SDK mistral-inference et TensorRT-LLM, avec une prise en charge également prévue dans llama.cpp pour l’inférence locale
- Les poids bruts sont téléchargeables sur HuggingFace
2 commentaires
Avis sur Hacker News
Des étapes sont nécessaires pour l’exécuter dans VS Code
Demande de recommandations de modèles avec une fonctionnalité FIM
Il faudrait mettre DeepSeek en avant dans la colonne MBPP
Ils ont annoncé que le modèle était sur HuggingFace, mais n’ont pas fourni le lien
C’est bien de voir un modèle très en vue utiliser Mamba2
Ils affirment que Mamba est plus rapide, mais ne donnent aucun chiffre de latence
Recommande une présentation produit sur les avantages et inconvénients de Mamba et des Transformers
Se demande s’il existe une bonne explication de l’architecture Mamba
Recommande une vidéo ou un article adapté à quelqu’un qui comprend le concept général des LLM, mais n’a utilisé que des outils largement publics comme ChatGPT, Claude, etc.
A effectué un test rapide dans le playground model.box
Codestral - le modèle d'IA de génération de code de Mistral