- Les modèles Grok-2 et Grok-2 mini sont publiés pour les utilisateurs de Grok sur la plateforme X
- Grok-2 offre des capacités de conversation, de codage et de raisonnement nettement améliorées par rapport au modèle précédent, Grok-1.5
- Une première version de Grok-2, testée sur le classement LMSYS sous le nom
sus-column-r, a montré de meilleures performances que Claude 3.5 Sonnet et GPT-4-Turbo
Modèle de langage et fonctions de chat de Grok-2
- Une première version de Grok-2 a été soumise à LMSYS Chatbot Arena (un outil de benchmark compétitif bien connu pour les LLM) sous le nom
sus-column-r
- Le modèle a dépassé Claude et GPT-4 en score Elo global
Benchmarks
- Le modèle Grok-2 a été évalué sur une série de benchmarks académiques couvrant le raisonnement, la compréhension écrite, les mathématiques, les sciences et le code
- Grok-2 et Grok-2 mini montrent des améliorations significatives par rapport au précédent modèle Grok-1.5
- Ils ont atteint des performances compétitives face à d'autres modèles de pointe dans des domaines comme les connaissances scientifiques de niveau graduate (GPQA), les connaissances générales (MMLU, MMLU-Pro) et les problèmes de concours de mathématiques (MATH)
- Grok-2 affiche des performances de pointe en raisonnement mathématique visuel (MathVista) et en questions-réponses sur documents (DocVQA)
Découvrir Grok avec les informations en temps réel sur X
- Grok a été continuellement amélioré sur la plateforme X
- Les utilisateurs de X Premium et Premium+ peuvent accéder à deux nouveaux modèles : Grok-2 et Grok-2 mini
- Grok-2 est accessible via l'onglet Grok de l'application X et constitue un assistant IA de pointe, avec des capacités avancées à la fois en texte et en compréhension visuelle
- Grok-2 mini est un modèle plus compact mais performant, conçu pour offrir un bon équilibre entre vitesse et qualité des réponses
- En collaboration avec Black Forest Labs, l'équipe expérimente le modèle FLUX.1 afin d'étendre les capacités de Grok sur X
Construire avec Grok via l'Enterprise API
- Grok-2 et Grok-2 mini seront lancés pour les développeurs plus tard dans le mois via une nouvelle plateforme d'API entreprise
- La nouvelle API repose sur une nouvelle pile technologique sur mesure permettant des déploiements d'inférence multi-régions accessibles avec une faible latence à l'échelle mondiale
- Elle fournit des fonctions de sécurité renforcées, comme l'authentification multifacteur obligatoire, des statistiques de trafic détaillées et des analyses avancées de facturation
- Elle propose une API d'administration permettant d'intégrer la gestion des équipes, des utilisateurs et de la facturation dans les outils et services internes existants
What is Next?
- Grok-2 et Grok-2 mini sont en cours de déploiement sur X
- L'équipe se dit très enthousiaste à propos des différentes fonctionnalités pilotées par l'IA proposées par Grok, comme la recherche améliorée, des analyses approfondies des posts X et des fonctions de réponse améliorées
- Un aperçu des capacités de compréhension multimodale sera bientôt présenté comme élément central de l'expérience Grok sur X et via l'API
- Depuis l'annonce de Grok-1 en novembre 2023, X.AI avance à un rythme extrêmement soutenu, porté par une petite équipe à très forte densité de talents
- Avec l'introduction de Grok-2, l'entreprise se positionne à l'avant-garde du développement de l'IA
- L'accent est mis sur le développement des capacités fondamentales de raisonnement grâce à un nouveau cluster de calcul
- Davantage d'évolutions seront partagées dans les mois à venir
- « Nous recherchons des personnes prêtes à rejoindre une petite équipe concentrée, dédiée à la création des innovations les plus marquantes pour l'avenir de l'humanité »
Aucun commentaire pour le moment.