- Lancement de Mistral NeMo, un modèle de 12 milliards de paramètres développé en collaboration avec NVIDIA
- Offre une large fenêtre de contexte allant jusqu’à 128k tokens
- Niveau parmi les meilleurs de sa catégorie en raisonnement, connaissances du monde et précision en code
- Utilise une architecture standard, ce qui permet une adoption facile dans les systèmes utilisant Mistral 7B
- Publication de checkpoints de base préentraînés et ajustés par instructions sous licence Apache 2.0 afin de favoriser l’adoption par les chercheurs et les entreprises
- Entraîné avec prise en compte de la quantification, permettant une inférence FP8 sans perte de performance
Modèle multilingue
- Conçu pour des applications multilingues mondiales
- Entraîné pour l’appel de fonctions et doté d’une grande fenêtre de contexte
- Particulièrement performant en anglais, français, allemand, espagnol, italien, portugais, chinois, japonais, coréen, arabe et hindi
- Vise à fournir un modèle d’IA de pointe aux utilisateurs de toutes les langues
Tekken, un tokenizer plus efficace
- Utilise Tekken, un nouveau tokenizer basé sur Tiktoken
- Compresse plus efficacement le texte en langage naturel et le code source dans plus de 100 langues qu’un tokenizer SentencePiece
- Environ 30 % plus efficace pour le code source, le chinois, l’italien, le français, l’allemand, l’espagnol et le russe
- Respectivement 2 fois et 3 fois plus efficace en coréen et en arabe
- Meilleure performance de compression dans environ 85 % des langues par rapport au tokenizer de Llama 3
Affinage par instructions
- Mistral NeMo passe par des étapes avancées de fine-tuning et d’alignement
- Nettement meilleur que Mistral 7B pour suivre précisément les instructions, raisonner, gérer des conversations multi-tours et générer du code
Liens
- Les poids des modèles de base et d’instructions sont hébergés sur HuggingFace
- Possibilité d’essayer Mistral NeMo avec mistral-inference et de l’ajuster avec mistral-finetune
- Packagé comme microservice d’inférence NVIDIA NIM, disponible sur ai.nvidia.com
1 commentaires
Avis sur Hacker News
Mistral NeMo est un modèle 12B développé en collaboration avec NVIDIA, offrant une grande fenêtre de contexte allant jusqu’à 128k tokens
Mistral NeMo utilise un nouveau tokenizer, Tekken, entraîné sur plus de 100 langues, qui compresse le texte et le code source plus efficacement que SentencePiece
Un billet sur Mistral NeMo est également disponible sur le blog de NVIDIA
Les grands modèles sortent rapidement, ce qui signifie que les entreprises ont trouvé comment faire monter en charge des processus évolutifs
Certains estiment que l’expérience d’inscription à NVIDIA Enterprise pour essayer la version empaquetée « NIM » est peu agréable
Certains estiment que si Mistral prend vraiment au sérieux le progrès de l’open source, l’entreprise devrait partager le corpus utilisé pour entraîner le modèle
Une question est posée sur le fait de savoir si l’entraînement multilingue apporte un « crossover »
Certains disent ne pas bien comprendre le modèle économique consistant à publier gratuitement des modèles d’IA générative open source