2 points par GN⁺ 2025-02-07 | 1 commentaires | Partager sur WhatsApp
  • Disponibilité générale de Gemini 2.0

    • Les modèles de la série Flash, présentés pour la première fois à l'I/O 2024, sont des modèles puissants optimisés pour un grand volume de tâches à haute fréquence, et ils ont gagné en popularité auprès des développeurs
    • 2.0 Flash est désormais disponible de manière générale pour davantage d'utilisateurs, avec des performances améliorées sur les principaux benchmarks
    • Des fonctionnalités de génération d'images et de transformation vocale seront également ajoutées prochainement
  • Modèle expérimental 2.0 Pro : meilleures performances en programmation et traitement de prompts complexes

    • Gemini 2.0 Pro est le modèle le plus performant pour la programmation et le traitement de prompts complexes, avec une meilleure compréhension des connaissances mondiales et des capacités de raisonnement renforcées
    • Il offre la plus grande fenêtre de contexte, avec 2 millions de tokens, permettant d'analyser et de comprendre de vastes quantités d'informations de manière globale
    • Il est proposé aux développeurs comme modèle expérimental dans Google AI Studio et Vertex AI, et il est également accessible aux utilisateurs de Gemini Advanced
  • 2.0 Flash-Lite : le modèle le plus rentable

    • Sur la base des retours positifs sur le prix et la rapidité de 1.5 Flash, 2.0 Flash-Lite offre une meilleure qualité pour la même vitesse et le même coût
    • Il surpasse 1.5 Flash sur la plupart des benchmarks, et prend en charge une fenêtre de contexte de 1 million de tokens ainsi que des entrées multimodales
    • Il est disponible en preview publique dans Google AI Studio et Vertex AI
  • Travail sur la responsabilité et la sécurité

    • À mesure que la famille de modèles Gemini gagne en puissance, des investissements soutenus se poursuivent pour garantir une utilisation sûre et sécurisée
    • De nouvelles techniques d'apprentissage par renforcement sont utilisées pour amener Gemini à critiquer ses propres réponses, afin de fournir des retours plus précis et mieux orientés vers l'objectif
    • Des red teams automatisées sont utilisées pour évaluer les risques d'attaques de cybersécurité telles que l'injection indirecte de prompts

1 commentaires

 
GN⁺ 2025-02-07
Avis Hacker News
  • Le manque d’informations claires sur les modèles Gemini est source de confusion. Il y a peu d’informations sur Gemini Advanced inclus dans l’abonnement Google Workspace.

    • Il n’y a que le nom « Gemini Advanced », sans option de sélection du modèle.
    • Google AI Studio se concentre sur la création d’apps wrapper pour LLM, mais n’est pas adapté aux utilisateurs qui veulent simplement poser des questions et obtenir des réponses.
    • Les informations trouvées via la recherche sont incertaines, et certaines indiquent que Gemini Advanced est inclus dans l’abonnement Workspace.
    • La page gemini.google.com ne donne aucune information sur les modèles, et le seul réglage disponible est le passage en mode sombre.
  • Il est possible d’accéder à l’API Gemini via Google AI Studio et Vertex AI.

    • Il existe différents modèles comme Gemini 2.0, 2.0 Pro, 2.0 Pro Experimental, Gemini 2.0 Flash et Gemini 2.0 Flash Lite.
    • Les benchmarks ne sont comparés qu’aux modèles internes.
  • Il existe des restrictions sur les sujets politiques en chat vocal.

    • Alors qu’un utilisateur parlait de son programme de cuisine, la conversation a été bloquée parce que cela a été interprété à tort comme un sujet politique.
  • Les noms des modèles d’IA prêtent à confusion.

    • Les conventions de nommage comme Flash ou Flash-Lite sont difficiles à comprendre.
    • Certains estiment que la qualité des modèles de Google est inférieure à celle d’autres grands acteurs du secteur.
  • Le rapport qualité-prix est excellent pour le parsing de PDF.

    • Gemini Flash-Lite est économique, et certains attendent avec intérêt les benchmarks de la version Lite.
  • Il est possible de tester les nouveaux modèles dans AI Studio.

    • Le mode live permet des conversations en temps réel et peut voir le monde à travers la caméra.
  • Le prix de Gemini 2.0 Flash-Lite est inférieur à celui de GPT-4o mini d’OpenAI.

    • Les tarifs pour les entrées texte/image et les entrées audio sont relativement bas.
  • Le modèle Gemini Pro 2.0 est jugé impressionnant.

    • Il convient bien aux tâches cognitives générales comme la recherche, l’analyse et l’écriture.
    • Son utilisation via AI Studio est recommandée, car l’app Gemini applique beaucoup de filtres et peut limiter les réponses sur des sujets controversés.
  • Le modèle Gemini 2.0 Flash est très performant pour les tâches multimodales.

    • Il est adapté au travail sur documents et à la détection d’objets, avec un excellent rapport qualité-prix.
    • Les modèles Qwen2.5 VL 72B et 7B offrent de meilleures performances sur les tâches liées aux images de documents.
  • Le modèle Gemini 2.0 Pro Experimental attire l’attention.

    • Il est excellent pour traiter des prompts complexes et pour le code, et offre une fenêtre de contexte de 2 millions de tokens.