Google affirme que Gemma 3 est le modèle d’IA le plus puissant pouvant fonctionner sur un seul GPU

(theverge.com)

2 points par GN⁺ 2025-03-23 | 1 commentaires | Partager sur WhatsApp

Google a annoncé Gemma 3, la nouvelle version de ses modèles d’IA Gemma, fondée sur la technologie Gemini AI
Gemma 3 est conçu pour permettre aux développeurs d’exécuter des applications d’IA sur diverses plateformes
- Peut fonctionner du smartphone à la station de travail
- Prend en charge plus de 35 langues
- Peut analyser du texte, des images et de courtes vidéos
Google affirme que Gemma 3 est le « meilleur modèle au monde sur un seul accélérateur »
- Offre de meilleures performances sur un seul GPU que les modèles de Facebook Llama, DeepSeek et OpenAI
- Performances optimisées sur les GPU Nvidia et le matériel d’IA dédié
- Encodeur de vision (vision encoder) amélioré
  - Prise en charge des images haute résolution et non carrées
- Inclut le nouveau classificateur de sécurité d’image ShieldGemma 2
  - Filtre les contenus sexuellement explicites ainsi que les contenus dangereux ou violents
Gemma 3 se classe parmi les premiers dans le classement par score ELO de Chatbot Arena
- A enregistré de hautes performances sur un seul GPU Nvidia H100
La controverse autour de la définition d’« ouvert » ou « open source » des modèles Gemma se poursuit
- La licence de Google impose des restrictions d’usage, et rien n’a changé à ce sujet dans cette annonce

1 commentaires

GN⁺ 2025-03-23

Commentaires sur Hacker News

Certains modèles d’IA peuvent prier. J’ai demandé un conseil biblique et il a dit qu’il prierait pour moi
Je me demande à quel point un petit modèle peut être « généralement intelligent ». Il doit bien y avoir une taille trop petite pour contenir toutes les informations
- Je me demande quand arriveront les petits modèles spécialisés dans des domaines précis. Par exemple, pour obtenir de l’aide en programmation, il n’est sans doute pas nécessaire de connaître le réalisateur de Jaws
- À l’avenir, il y aura probablement beaucoup de petits modèles spécialisés
- Ou peut-être que la puissance de calcul progressera au point de permettre l’exécution de modèles pleinement capables sur un ordinateur de bureau ou un téléphone
On ne considérera peut-être pas que Llama 3.3 70B s’exécute sur « un seul GPU », mais il tourne très bien sur un seul Mac
- Il est bien meilleur que Gemma 3 pour conserver les concepts au fil de longues conversations
Gemma 3 est bien meilleur que la version 2 pour l’écriture
- La grande amélioration, c’est qu’on peut réellement utiliser une fenêtre de contexte de 32k+ sans qu’elle se transforme en déchets aléatoires
Cela n’a tenu qu’une semaine après la sortie de Mistral 3.1 Small. Le rythme des progrès de l’IA est rapide
Mistral Small 3.1 est sorti après Gemma 3 et il est bien meilleur
- Il refuse moins, est plus précis, divague moins, et il est meilleur en particulier pour le code
Techniquement, DeepSeek R1 en quantification 1.58-bit Unsloth tourne sur un seul GPU avec 128 Go de RAM système
- Les performances sont excellentes, mais mieux vaut ne pas être pressé
Publication de Google la semaine dernière : [lien]
Je me demande si quelqu’un utilise GoogleAI
- Je travaille dans une entreprise d’IA avec un CEO IA qui utilise la traduction linguistique par IA, mais tous les vrais produits GPT sont catastrophiques et ont mauvaise réputation
- Qui voudrait envoyer ses conversations privées à Google pour être surveillé ?
Je me demande si cela tourne sur du matériel bridé

Google affirme que Gemma 3 est le modèle d’IA le plus puissant pouvant fonctionner sur un seul GPU

À lire aussi

1 commentaires

Commentaires sur Hacker News