Lancement de la bêta du nouveau service de plateforme de Mistral AI
- Mistral AI propose aux développeurs de puissants modèles génératifs open source ainsi que des moyens de les déployer et de les personnaliser efficacement.
- La société ouvre aujourd’hui l’accès bêta à son premier service de plateforme, qui propose trois endpoints de chatbot générant du texte à partir d’instructions textuelles, ainsi qu’un endpoint d’embedding.
- Chaque endpoint présente un compromis différent entre performances et prix.
Endpoints de génération
mistral-tinyetmistral-smallutilisent les deux modèles actuellement publiés, tandis quemistral-mediums’appuie sur un modèle prototype en cours de test en environnement de production.- Les modèles intègrent les techniques d’alignement les plus efficaces, comme le fine-tuning efficace et l’optimisation directe des préférences, afin de créer des modèles faciles à contrôler et agréables à utiliser.
Mistral-tinyprend uniquement en charge l’anglais,Mistral-smallprend en charge plusieurs langues et le code, etMistral-mediumest considéré comme l’un des meilleurs modèles de service.
Endpoint d’embedding
Mistral-embedpropose un modèle d’embedding conçu pour la recherche, avec une dimension d’embedding de 1024.- Ce modèle d’embedding a obtenu un score de recherche de 55.26 sur le MTEB.
Spécifications de l’API
- L’API suit les spécifications d’une interface de chatbot populaire proposée initialement par un concurrent.
- Des bibliothèques clientes Python et Javascript sont fournies pour interroger les endpoints.
- Les endpoints permettent de fournir des prompts système afin que les utilisateurs puissent définir un niveau plus élevé de modération sur les sorties du modèle.
Passage de l’accès bêta à la disponibilité générale
- À partir d’aujourd’hui, tout le monde peut s’inscrire et utiliser l’API, et la capacité sera augmentée progressivement.
- L’équipe business peut aider à identifier les besoins et à accélérer l’accès.
- Certaines parties peuvent rester instables pendant la phase de stabilisation de la plateforme pour la rendre entièrement self-service.
Remerciements
- Merci à NVIDIA pour son soutien à l’intégration de TensorRT-LLM et Triton, ainsi que pour le travail mené ensemble afin de créer un mélange d’experts sparse compatible avec TRT-LLM.
L’avis de GN⁺
- Le point le plus important de cet article est que Mistral AI met à disposition des développeurs de nouveaux modèles génératifs et d’embedding, leur permettant de bénéficier de meilleures capacités de génération de texte et d’embedding.
- Ces technologies devraient accélérer les progrès de l’IA, et leur capacité à prendre en charge diverses langues et le code élargira considérablement leur potentiel d’application sur le marché mondial.
- Pour les développeurs, cela représente une opportunité enthousiasmante de créer des projets et des solutions innovants grâce à de nouveaux outils et API, ce qui renforce les attentes autour de l’avenir de la technologie.
1 commentaires
Avis Hacker News