2 points par xguru 2024-08-16 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Les modèles Grok-2 et Grok-2 mini sont publiés pour les utilisateurs de Grok sur la plateforme X
  • Grok-2 offre des capacités de conversation, de codage et de raisonnement nettement améliorées par rapport au modèle précédent, Grok-1.5
  • Une première version de Grok-2, testée sur le classement LMSYS sous le nom sus-column-r, a montré de meilleures performances que Claude 3.5 Sonnet et GPT-4-Turbo

Modèle de langage et fonctions de chat de Grok-2

  • Une première version de Grok-2 a été soumise à LMSYS Chatbot Arena (un outil de benchmark compétitif bien connu pour les LLM) sous le nom sus-column-r
  • Le modèle a dépassé Claude et GPT-4 en score Elo global

Benchmarks

  • Le modèle Grok-2 a été évalué sur une série de benchmarks académiques couvrant le raisonnement, la compréhension écrite, les mathématiques, les sciences et le code
  • Grok-2 et Grok-2 mini montrent des améliorations significatives par rapport au précédent modèle Grok-1.5
  • Ils ont atteint des performances compétitives face à d'autres modèles de pointe dans des domaines comme les connaissances scientifiques de niveau graduate (GPQA), les connaissances générales (MMLU, MMLU-Pro) et les problèmes de concours de mathématiques (MATH)
  • Grok-2 affiche des performances de pointe en raisonnement mathématique visuel (MathVista) et en questions-réponses sur documents (DocVQA)

Découvrir Grok avec les informations en temps réel sur X

  • Grok a été continuellement amélioré sur la plateforme X
  • Les utilisateurs de X Premium et Premium+ peuvent accéder à deux nouveaux modèles : Grok-2 et Grok-2 mini
  • Grok-2 est accessible via l'onglet Grok de l'application X et constitue un assistant IA de pointe, avec des capacités avancées à la fois en texte et en compréhension visuelle
  • Grok-2 mini est un modèle plus compact mais performant, conçu pour offrir un bon équilibre entre vitesse et qualité des réponses
  • En collaboration avec Black Forest Labs, l'équipe expérimente le modèle FLUX.1 afin d'étendre les capacités de Grok sur X

Construire avec Grok via l'Enterprise API

  • Grok-2 et Grok-2 mini seront lancés pour les développeurs plus tard dans le mois via une nouvelle plateforme d'API entreprise
  • La nouvelle API repose sur une nouvelle pile technologique sur mesure permettant des déploiements d'inférence multi-régions accessibles avec une faible latence à l'échelle mondiale
  • Elle fournit des fonctions de sécurité renforcées, comme l'authentification multifacteur obligatoire, des statistiques de trafic détaillées et des analyses avancées de facturation
  • Elle propose une API d'administration permettant d'intégrer la gestion des équipes, des utilisateurs et de la facturation dans les outils et services internes existants

What is Next?

  • Grok-2 et Grok-2 mini sont en cours de déploiement sur X
    • L'équipe se dit très enthousiaste à propos des différentes fonctionnalités pilotées par l'IA proposées par Grok, comme la recherche améliorée, des analyses approfondies des posts X et des fonctions de réponse améliorées
  • Un aperçu des capacités de compréhension multimodale sera bientôt présenté comme élément central de l'expérience Grok sur X et via l'API
  • Depuis l'annonce de Grok-1 en novembre 2023, X.AI avance à un rythme extrêmement soutenu, porté par une petite équipe à très forte densité de talents
  • Avec l'introduction de Grok-2, l'entreprise se positionne à l'avant-garde du développement de l'IA
  • L'accent est mis sur le développement des capacités fondamentales de raisonnement grâce à un nouveau cluster de calcul
  • Davantage d'évolutions seront partagées dans les mois à venir
  • « Nous recherchons des personnes prêtes à rejoindre une petite équipe concentrée, dédiée à la création des innovations les plus marquantes pour l'avenir de l'humanité »

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.