10 points par xguru 2025-02-19 | 1 commentaires | Partager sur WhatsApp
  • La mission de xAI est de comprendre la nature de l’univers, et pour cela l’entreprise développe Grok, une IA qui place la recherche de la vérité au premier plan
  • Grok 3 affiche des performances plus de 10 fois supérieures à celles de Grok 2, grâce au travail d’une équipe exceptionnelle et à d’importantes ressources de calcul
    • Grok est un mot employé par un personnage élevé sur Mars dans le roman de Heinlein Stranger in a Strange Land et signifie « comprendre quelque chose de manière complète et profonde »
    • L’empathie (empathy) joue également un rôle important
  • xAI a lancé son premier modèle il y a 17 mois, et Grok 1 était un modèle de 314B (314 milliards) de paramètres
    • Après Grok 1.5 puis Grok 2, le développement a conduit à Grok 3, avec une amélioration spectaculaire des performances
  • Centre de données : xAI a construit son propre data center pour accélérer le développement de Grok
    • Il a fallu 122 jours pour mettre en service un premier cluster de 100 000 GPU, puis 92 jours supplémentaires pour doubler la capacité à 200K
    • Il s’agit du plus grand cluster H100 entièrement interconnecté au monde, et toute cette puissance de calcul a servi à améliorer Grok
  • Grok 3 : des performances supérieures de plus de 10 fois à Grok 2 (en réalité plus de 15 fois)
    • Le pré-entraînement s’est achevé début janvier, et l’apprentissage se poursuit encore aujourd’hui
  • Benchmarks : Grok 3 montre d’excellentes performances en raisonnement mathématique général, dans les sciences et en code
    • La version plus légère, Grok 3 Mini, se situe également au niveau de ses concurrents
    • Il enregistre notamment des résultats de tout premier plan sur les problèmes de l’AIME (American Invitational Mathematics Examination)
    • Dans la dernière évaluation de chatbots (Chatbot Arena), il a dépassé les 1 400 points ELO et s’est classé n°1 parmi tous les modèles

Nouvelles fonctionnalités de Grok 3

  • Raisonnement avancé (Advanced Reasoning)
    • Grok 3 ne se contente pas de fournir une réponse : il dispose d’une capacité à trouver une solution en passant par un processus de réflexion approfondi
    • Il renforce sa capacité à analyser les problèmes, détecter les erreurs et explorer différentes possibilités
    • Cas concrets :
      • Calcul de trajectoire vers Mars : simulation d’une trajectoire aller-retour Terre-Mars avec restitution visuelle
      • Création d’un nouveau jeu : génération à la volée d’un nouveau jeu combinant Tetris et Zuma
  • Capacité d’apprentissage en temps réel de Grok 3
    • De nouvelles améliorations sont apportées chaque jour, avec des écarts de performance visibles d’un jour à l’autre
    • Le modèle continue d’évoluer même pendant les tests
  • Améliorations d’ingénierie grâce à Grok 3
    • Grok 3 permet aussi en interne de réduire de plusieurs centaines d’heures le travail de code et de résolution de problèmes
    • En résolvant des problèmes de mathématiques et de programmation compétitive, il a appris à détecter et corriger lui-même ses erreurs

Fonctionnalités de nouvelle génération : des agents basés sur Grok 3

  • Deep Search
    • Un nouveau moteur de recherche IA qui va chercher des informations plus en profondeur qu’un moteur de recherche classique
    • Il analyse les informations de plusieurs sites et compare les données les plus récentes pour fournir la réponse la plus fiable
    • Exemples :
      • Consultation de la date du prochain lancement de Starship
      • Analyse des builds populaires de Path of Exile
      • Prédiction du vainqueur du tournoi de basket March Madness
  • Assistant vocal IA (Voice Assistant)
    • Une fonctionnalité permettant à l’utilisateur de communiquer avec Grok comme dans une véritable conversation doit être ajoutée
    • Grok ne se limite pas à une simple conversion texte-voix : il pourra converser naturellement en tenant compte du ton, des émotions et de l’intonation

Lancement de Grok 3 et feuille de route

  • Calendrier de lancement
    • À partir d’aujourd’hui, la bêta de Grok 3 est proposée aux abonnés Premium+
    • Une mise à jour de l’application X (ex-Twitter) permet d’accéder aux nouvelles fonctionnalités
    • Lancement du site autonome grok.com ainsi que de l’application Grok dédiée (iOS/Android)
  • Nouvelle option d’abonnement : Super Grok
    • Lancement de l’offre Super Grok, destinée aux utilisateurs qui veulent tester rapidement les fonctionnalités les plus récentes
  • Projets à venir
    • Lancement de l’API Grok 3 prévu dans les prochaines semaines
    • Publication en open source de Grok 3 prévue dans les prochains mois
    • Construction d’un cluster de nouvelle génération encore plus puissant (5 fois la performance actuelle)
    • Création d’un studio de jeux IA pour accélérer le développement de jeux basés sur l’IA

Conclusion

  • Grok 3 ouvre une nouvelle dimension pour les modèles d’IA, et xAI travaille à le faire encore progresser
  • Grâce à ses fortes capacités de raisonnement, son moteur de recherche IA et sa fonction d’assistant vocal, Grok évolue progressivement vers un véritable assistant IA
  • Elon Musk estime qu’à l’avenir, l’IA pourra atteindre des accomplissements académiques comparables à la médaille Fields

1 commentaires

 
GN⁺ 2025-02-19
Avis Hacker News
  • Karpathy a décrit sa première impression de Grok comme étant du niveau d'OpenAI o1-pro
  • Grok a atteint le plus haut niveau sur un benchmark
  • La concurrence dans le domaine des LLM devient intense, ce qui est une bonne nouvelle pour les consommateurs
    • En espérant qu'une entreprise en situation de monopole n'absorbe pas toute la valeur
  • Il existe des preuves qu'il est possible de construire un LLM de pointe avec peu de coûts
  • Le contenu enregistré n'a pas été inspirant
    • Il n'y avait rien de nouveau, c'était quelque chose que l'on savait déjà
  • Beaucoup pensent qu'ils sont en train d'imiter OpenAI
    • OpenAI montre toujours ce qu'il est possible de faire
  • Il faut reconnaître que xAI a rattrapé son retard rapidement
    • Non seulement sur le modèle, mais aussi sur le produit
  • Le meilleur effet d'un Grok compétitif pourrait être de briser la perception populaire de ChatGPT
  • Karpathy pense que c'est du niveau d'o1-pro
  • OpenAI prouve à nouveau qu'il n'y a pas de barrière technologique
    • Ils estiment que l'offre de rachat d'OpenAI par Elon est justifiée
  • Elon est populaire en Chine et peut donc facilement recruter des ingénieurs IA
    • Il peut proposer des actions xAI/XSpace/Neurallink
  • Bonne chance aux investisseurs qui valorisent OpenAI à plus de 100 milliards de dollars
  • Il est prévu de publier les poids de Grok 2
  • On imagine un futur où les LLM insèrent des publicités personnalisées