Gemma - les modèles ouverts de pointe de Google
(blog.google)- Google affirme sa conviction de construire une IA utile pour tous et a contribué à l’innovation de la communauté open source avec des avancées comme Transformers, TensorFlow, BERT, T5, JAX, AlphaFold et AlphaCode
- Gemma est une famille de modèles ouverts légers et de pointe, conçus à partir des mêmes recherches et technologies que celles utilisées pour créer les modèles Gemini
- Développée par Google DeepMind et d’autres équipes, elle s’inspire de « gemma », un mot latin signifiant « joyau »
- Disponible dès aujourd’hui dans le monde entier, avec les poids des modèles, des outils pour soutenir l’innovation des développeurs, favoriser la collaboration et guider une utilisation responsable des modèles Gemma
- En partageant les composants technologiques et d’infrastructure de Gemini, Gemma 2B et 7B atteignent les meilleures performances de leur catégorie au regard de leur taille par rapport aux autres modèles ouverts
- Ils peuvent être exécutés directement sur l’ordinateur portable ou le PC de bureau d’un développeur, tout en surpassant des modèles bien plus grands sur les principaux benchmarks et en respectant des normes strictes pour produire des résultats sûrs et responsables
- Fournit, via Keras 3.0 natif, une toolchain pour l’inférence et le SFT (supervised fine-tuning) sur tous les principaux frameworks, dont JAX, PyTorch et TensorFlow
- Il est facile de démarrer avec Gemma grâce à l’intégration avec les notebooks Colab et Kaggle ainsi qu’avec des outils populaires comme Hugging Face, MaxText, NVIDIA NeMo et TensorRT-LLM
- Les modèles Gemma préentraînés et instruction-tunés peuvent être facilement déployés sur Vertex AI et Google Kubernetes Engine (GKE) pour s’exécuter sur un notebook, une station de travail ou Google Cloud
- Des optimisations pour plusieurs plateformes matérielles IA, notamment les GPU NVIDIA et les TPU Google Cloud, garantissent des performances de premier plan dans l’industrie
- L’utilisation et le déploiement commerciaux sont autorisés, pour les organisations de toute taille, conformément aux conditions d’utilisation
Conçus de manière responsable
- Gemma a été conçu en donnant la priorité aux principes de l’IA, avec des techniques automatisées pour filtrer les informations personnelles et autres données sensibles des ensembles d’entraînement
- En outre, l’apprentissage par renforcement à partir de retours humains (RLHF) a été largement utilisé pour les modèles ajustés par instruction afin de les aligner sur un comportement responsable
- Des évaluations robustes ont été menées pour comprendre et réduire le profil de risque des modèles Gemma, notamment via du red teaming manuel, des tests adversariaux automatisés et l’évaluation des capacités du modèle concernant les activités dangereuses
Optimisés à travers frameworks, outils et matériel
- Les modèles Gemma peuvent être affinés sur vos propres données pour répondre aux besoins d’applications spécifiques et prennent en charge divers outils et systèmes
- Outils multi-framework : accès aux frameworks privilégiés comme Keras 3.0, PyTorch natif, JAX et Hugging Face Transformers. Des implémentations de référence sont fournies
- Compatibilité cross-device : exécution possible sur des appareils populaires, notamment ordinateurs portables, PC de bureau, IoT, mobile et cloud
- Plateformes matérielles de pointe : grâce à un partenariat avec NVIDIA, les optimisations pour les GPU NVIDIA — du data center au cloud en passant par les RTX AI PC locaux — garantissent des performances de premier plan et une intégration avec les technologies les plus avancées
- Optimisé pour Google Cloud : Vertex AI fournit un vaste ensemble d’outils MLOps et diverses options d’ajustement, avec un déploiement en un clic grâce aux optimisations d’inférence intégrées
Crédits gratuits pour la recherche et le développement
- Gemma a été conçu pour la communauté des développeurs et chercheurs qui fait avancer l’innovation en IA, et il est possible de commencer dès aujourd’hui grâce à l’accès gratuit sur Kaggle, au niveau gratuit des notebooks Colab et à un crédit de 300 $ pour les nouveaux utilisateurs de Google Cloud
- Les chercheurs peuvent demander jusqu’à 500 000 $ de crédits Google Cloud pour accélérer leurs projets
2 commentaires
Maintenant, il n’y a plus que l’IA ouverte qui soit fermée.
Avis sur Hacker News
d_model, contrairement à la plupart des modèles où elle est de 4 fois ;