Gemini : le modèle d’IA le plus performant jamais conçu par Google à ce jour

(blog.google)

1 points par GN⁺ 2023-12-07 | 1 commentaires | Partager sur WhatsApp

Titre du résumé : présentation de « Gemini », le nouveau modèle d’IA de Google et DeepMind

Sundar Pichai, CEO de Google et d’Alphabet, estime que l’IA apportera un changement plus important encore que la transition vers le mobile ou le web.
En tant qu’entreprise centrée sur l’IA, Google a parcouru un chemin de huit ans, et l’IA générative permet désormais aux utilisateurs de collaborer et de créer de nouvelles façons.
Google poursuit à la fois une ambition forte dans la recherche et la capacité d’apporter de grands bénéfices à la société, tout en travaillant avec les gouvernements et des experts pour traiter les risques liés à l’IA.

Présentation de Gemini

Demis Hassabis, CEO et cofondateur de Google DeepMind, estime que l’IA apportera des bénéfices extraordinaires à l’humanité.
Gemini est le modèle le plus capable jamais créé grâce à une collaboration de grande ampleur entre les équipes de Google, et il peut comprendre et manipuler différents types d’informations, comme le texte, le code, l’audio, les images et la vidéo.
Gemini 1.0 est optimisé en trois tailles et peut fonctionner efficacement aussi bien dans des data centers que sur des appareils mobiles.

Performances de pointe

Les modèles Gemini affichent des performances qui dépassent l’état de l’art actuel sur diverses tâches.
Gemini Ultra a obtenu un score de 90,0 % sur le MMLU, avec des performances supérieures à celles d’experts humains.
Il dépasse également les modèles précédents sur des benchmarks d’images, montrant les premiers signes des capacités de raisonnement complexes de Gemini.

Capacités de nouvelle génération

Gemini est multimodal de manière native, et ses capacités de compréhension et de raisonnement sur différentes modalités sont bien supérieures à celles des modèles existants.
Gemini 1.0 excelle particulièrement dans l’extraction de connaissances à partir de documents complexes et dans l’explication du raisonnement sur des sujets difficiles comme les mathématiques et la physique.
Gemini peut comprendre et générer du code de haute qualité, et fait partie des modèles fondamentaux de premier plan pour le travail entre langages de programmation et le raisonnement sur des informations complexes.

Plus fiable, évolutif et efficace

Gemini 1.0 a été entraîné à grande échelle à l’aide de l’infrastructure optimisée pour l’IA de Google ainsi que des TPU v4 et v5e.
Gemini s’exécute plus rapidement que les modèles précédents et s’appuie sur des accélérateurs d’IA sur mesure qui jouent un rôle clé dans les produits IA de Google.
Google a annoncé Cloud TPU v5p pour accélérer le développement de Gemini et permettre aux développeurs d’entraîner plus rapidement de grands modèles d’IA.

Conçu avec la responsabilité et la sécurité au cœur

Google ajoute de nouvelles mesures de protection en tenant compte des capacités multimodales de Gemini et considère les risques potentiels à chaque étape du développement.
Gemini a fait l’objet de l’évaluation de sécurité la plus complète parmi les modèles d’IA de Google, et Google a collaboré avec des experts externes pour identifier les angles morts de ses méthodes d’évaluation internes.
Gemini utilise des classificateurs de sécurité et des filtres robustes pour identifier et classer des contenus tels que la violence ou les stéréotypes négatifs.

Mettre Gemini à disposition du monde

Gemini 1.0 est en cours d’intégration dans les produits et plateformes de Google, et Bard utilise une version avancée de Gemini Pro pour offrir un raisonnement et une compréhension plus poussés.
Les développeurs et clients entreprises peuvent accéder à Gemini Pro via Google AI Studio ou Google Cloud Vertex AI.
Gemini Ultra sera proposé à des clients, développeurs, partenaires et experts sélectionnés pour recueillir des retours en phase initiale, après des vérifications de fiabilité et de sécurité.

L’avis de GN⁺

Le point le plus important de cet article est que Google et DeepMind ont développé un nouveau modèle d’IA appelé Gemini, ouvrant une nouvelle ère pour la technologie de l’IA. Grâce à ses capacités multimodales, Gemini peut comprendre et traiter différents types d’informations, comme le texte, les images et l’audio, ce qui offre aux développeurs et aux entreprises l’occasion de créer des produits et services encore plus innovants. Cet article est intéressant parce qu’il donne des exemples concrets de la manière dont la technologie de l’IA peut transformer la vie humaine, tout en montrant l’approche de Google sur la façon dont ces avancées doivent être menées de manière responsable.

1 commentaires

GN⁺ 2023-12-07

C’est également un doublon sur HN, donc vous pouvez consulter le post que j’ai publié séparément sur GeekNews : Google dévoile le modèle d’IA Gemini.