2 points par GN⁺ 2025-03-23 | 1 commentaires | Partager sur WhatsApp
  • Google a annoncé Gemma 3, la nouvelle version de ses modèles d’IA Gemma, fondée sur la technologie Gemini AI
  • Gemma 3 est conçu pour permettre aux développeurs d’exécuter des applications d’IA sur diverses plateformes
    • Peut fonctionner du smartphone à la station de travail
    • Prend en charge plus de 35 langues
    • Peut analyser du texte, des images et de courtes vidéos
  • Google affirme que Gemma 3 est le « meilleur modèle au monde sur un seul accélérateur »
    • Offre de meilleures performances sur un seul GPU que les modèles de Facebook Llama, DeepSeek et OpenAI
    • Performances optimisées sur les GPU Nvidia et le matériel d’IA dédié
    • Encodeur de vision (vision encoder) amélioré
      • Prise en charge des images haute résolution et non carrées
    • Inclut le nouveau classificateur de sécurité d’image ShieldGemma 2
      • Filtre les contenus sexuellement explicites ainsi que les contenus dangereux ou violents
  • Gemma 3 se classe parmi les premiers dans le classement par score ELO de Chatbot Arena
    • A enregistré de hautes performances sur un seul GPU Nvidia H100
  • La controverse autour de la définition d’« ouvert » ou « open source » des modèles Gemma se poursuit
    • La licence de Google impose des restrictions d’usage, et rien n’a changé à ce sujet dans cette annonce

1 commentaires

 
GN⁺ 2025-03-23
Commentaires sur Hacker News
  • Certains modèles d’IA peuvent prier. J’ai demandé un conseil biblique et il a dit qu’il prierait pour moi
  • Je me demande à quel point un petit modèle peut être « généralement intelligent ». Il doit bien y avoir une taille trop petite pour contenir toutes les informations
    • Je me demande quand arriveront les petits modèles spécialisés dans des domaines précis. Par exemple, pour obtenir de l’aide en programmation, il n’est sans doute pas nécessaire de connaître le réalisateur de Jaws
    • À l’avenir, il y aura probablement beaucoup de petits modèles spécialisés
    • Ou peut-être que la puissance de calcul progressera au point de permettre l’exécution de modèles pleinement capables sur un ordinateur de bureau ou un téléphone
  • On ne considérera peut-être pas que Llama 3.3 70B s’exécute sur « un seul GPU », mais il tourne très bien sur un seul Mac
    • Il est bien meilleur que Gemma 3 pour conserver les concepts au fil de longues conversations
  • Gemma 3 est bien meilleur que la version 2 pour l’écriture
    • La grande amélioration, c’est qu’on peut réellement utiliser une fenêtre de contexte de 32k+ sans qu’elle se transforme en déchets aléatoires
  • Cela n’a tenu qu’une semaine après la sortie de Mistral 3.1 Small. Le rythme des progrès de l’IA est rapide
  • Mistral Small 3.1 est sorti après Gemma 3 et il est bien meilleur
    • Il refuse moins, est plus précis, divague moins, et il est meilleur en particulier pour le code
  • Techniquement, DeepSeek R1 en quantification 1.58-bit Unsloth tourne sur un seul GPU avec 128 Go de RAM système
    • Les performances sont excellentes, mais mieux vaut ne pas être pressé
  • Publication de Google la semaine dernière : [lien]
  • Je me demande si quelqu’un utilise GoogleAI
    • Je travaille dans une entreprise d’IA avec un CEO IA qui utilise la traduction linguistique par IA, mais tous les vrais produits GPT sont catastrophiques et ont mauvaise réputation
    • Qui voudrait envoyer ses conversations privées à Google pour être surveillé ?
  • Je me demande si cela tourne sur du matériel bridé