Google dévoile son modèle d’IA Gemini
(blog.google)- Gemini est le premier modèle d’IA à dépasser les experts humains avec un score de 90 % sur MMLU
- Modèle d’IA multimodal, il surpasse aussi GPT-4V et Whisper sur des benchmarks multimodaux image/vidéo/audio
- Optimisé en trois modèles selon la taille
- Ultra : le modèle le plus grand et le plus performant pour les tâches complexes
- Pro : extensible sur un large éventail de tâches
- Nano : le modèle le plus efficace pour les tâches on-device
- Comprend, explique et génère du code de haute qualité dans les langages de programmation les plus utilisés au monde, comme Python, Java, C++, Go, etc.
- Lancement également d’AlphaCode 2 pour la programmation compétitive, basé sur Gemini
- Gemini 1.0 a été entraîné à grande échelle sur une infrastructure optimisée pour l’IA utilisant les TPU v4 et v5e
- Plus stable, plus extensible et plus efficace
- Accent mis sur la responsabilité et la sécurité
- Des évaluations complètes de sécurité ont été menées
- Gemini Pro est disponible directement dans Google Bard
- Disponible en anglais dans 170 pays, avec prise en charge prochaine d’autres modalités et de nouvelles langues
- Gemini Nano sera intégré au Pixel 8 Pro
- Gemini sera appliqué dans les prochains mois à Search, Ads, Chrome et Duet AI
- À partir du 13 décembre, les développeurs et clients entreprises pourront utiliser l’API Gemini via Google AI Studio et Google Cloud Vertex AI (Pro uniquement)
- Gemini Ultra sera lui aussi bientôt disponible
- Google finalise de vastes contrôles de confiance et de sécurité, y compris une validation par red team avec des organismes externes de confiance, et affine encore le modèle via le RLHF et des ajustements fins avant une diffusion plus large
- Gemini Ultra sera d’abord proposé à certains clients, développeurs, partenaires et experts en sécurité et responsabilité pour des tests initiaux et des retours, avant une ouverture aux développeurs et clients entreprises au début de l’année prochaine
- Au début de l’année prochaine, Google prévoit aussi de lancer Bard Advanced, un nouvel environnement d’IA de pointe donnant accès à ses meilleurs modèles et capacités, à commencer par Gemini Ultra
7 commentaires
En voyant la vidéo, je me suis dit : « Bard n’était déjà pas terrible, et ils auraient déjà réussi à le surpasser complètement ? »
Apparemment, c’était une vidéo mise en scène. Dans ce cas, ce n’est pas de la tromperie..?
https://www.tomshardware.com/news/google-gemini-ai-video-staged
Je me souviens de ce tweet : « Certains pensent que Google est en retard dans l'IA, mais ils sont à leur propre another level. »
Aujourd'hui, l'action Google a beaucoup monté.
Il semblerait que nano soit disponible sur le Pixel 8 Pro... mais bon
https://blog.google/products/pixel/pixel-feature-drop-december-2023/
Dans le champ d'application, il n'y a finalement que Voice Recorder, qui ne prend pas en charge le français, et gboard, pour lequel il faut s'inscrire séparément à la bêta.
Donc ce n’est pas pour ça qu’ils ne vendent pas le Pixel en Corée, non..? haha
J’ai encore mon Pixel 1, moi T_T
Enfin, c’est sorti. J’ai hâte de voir à quoi cela ressemblera si c’est déployé de manière globale dans les produits Google.
La vidéo la plus intéressante est Hands-on with Gemini: Interacting with multimodal AI.
Elle dure environ 6 minutes, donc regardez-la absolument. Si l'IA multimodale continue de progresser, le Jarvis que nous voyions dans les films deviendra réalité.
GPT-4 Vision était déjà impressionnant, mais on dirait vraiment que l’ère du vrai Jarvis est en train d’arriver... +_+