6 points par GN⁺ 2026-01-30 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Le Project Genie de Google est un prototype de recherche expérimental qui permet aux utilisateurs de générer, explorer et remixer des mondes virtuels interactifs à l’aide de texte et d’images
  • Il repose sur le modèle Genie 3 et génère en temps réel les trajets et l’environnement en fonction des déplacements de l’utilisateur
  • Proposé sous la forme d’une web app, il intègre les modèles Nano Banana Pro et Gemini pour prendre en charge l’esquisse de mondes, l’exploration et le remix
  • En raison des limites du modèle, cette première version comporte des contraintes telles que des incohérences avec les lois de la physique, une latence dans le contrôle des personnages et une limite de 60 secondes
  • Il est actuellement accessible aux abonnés Google AI Ultra (18 ans et plus) aux États-Unis, avec une extension prévue à d’autres régions

Présentation de Project Genie

  • Project Genie est un prototype de recherche expérimental développé par Google DeepMind sur la base de Genie 3, qui offre un environnement où les utilisateurs peuvent créer, explorer et remixer eux-mêmes des mondes virtuels
    • Accessible aux abonnés Google AI Ultra (18 ans et plus) aux États-Unis
    • Les utilisateurs peuvent générer des mondes à partir de prompts textuels et d’images, puis les explorer en temps réel
  • Ce projet constitue une première étape pour rendre la technologie de génération de mondes immersifs accessible au grand public, et s’inscrit comme une extension de la recherche sur les world models

Progrès des world models

  • Les world models sont des systèmes capables de simuler les changements dynamiques d’un environnement et de prédire l’impact des actions
  • Google DeepMind vise à aller au-delà de la recherche sur des agents conçus pour des environnements spécifiques comme les échecs ou le go, avec l’objectif de développer des systèmes AGI capables d’explorer la diversité du monde réel
  • Genie 3 génère les trajets en temps réel en fonction des déplacements de l’utilisateur et simule les interactions physiques
    • Il prend en charge une génération de mondes dynamique, et non de simples instantanés 3D statiques
    • Il peut être utilisé dans divers scénarios comme la robotique, l’animation, la fiction ou l’exploration de lieux historiques

Fonctionnement de Project Genie

  • Il s’agit d’un prototype web, intégrant non seulement Genie 3 mais aussi les modèles Nano Banana Pro et Gemini
  • Il se compose de trois fonctions clés
  • 1. World Sketching (esquisse de monde)

    • Concevoir un environnement vivant à partir de texte et d’images (générées ou importées)
    • Il est possible de définir le personnage et la manière d’explorer, avec la prise en charge de différents modes de déplacement comme la marche, le vol ou la conduite
    • L’intégration de Nano Banana Pro permet de prévisualiser le monde et d’en ajuster les détails
    • Choix possible entre une vue à la première ou à la troisième personne
  • 2. World Exploration (exploration du monde)

    • Les mondes générés deviennent des environnements explorables, où les trajets sont créés en temps réel selon les actions de l’utilisateur
    • Il est possible d’ajuster le point de vue de la caméra pendant l’exploration
  • 3. World Remixing (remix du monde)

    • Il est possible de recomposer un nouveau monde avec une interprétation différente à partir du prompt d’un monde existant
    • Grâce à une galerie ou à une fonction d’exploration aléatoire, on peut explorer ou modifier les mondes d’autres utilisateurs
    • Les mondes terminés et le parcours d’exploration peuvent être téléchargés sous forme de vidéo

Construire une IA responsable

  • Project Genie est un prototype de recherche expérimental mené au sein de Google Labs, et il est exploité conformément aux principes de développement responsable de l’IA
  • En raison des limites actuelles du modèle, les contraintes suivantes sont précisées
    • Les mondes générés peuvent différer de la réalité ou être incohérents avec le prompt ou les lois de la physique
    • Une latence dans le contrôle des personnages ou une baisse de réactivité peuvent survenir
    • Une limite de génération de 60 secondes est imposée
  • La fonction de variation d’événements pilotée par prompt, annoncée en août 2025, n’est pas encore incluse
  • Les futures mises à jour et améliorations pourront être suivies sur la page officielle de DeepMind

Projets à venir et élargissement de l’accès

  • Project Genie a été développé sur la base d’une recherche collaborative avec des testeurs de confiance
  • Cette ouverture constitue une étape destinée à comprendre comment les utilisateurs emploient réellement les world models
  • Pour l’instant, il est réservé aux abonnés Google AI Ultra aux États-Unis, avec un élargissement prévu à davantage de régions
  • À long terme, Google prévoit de rendre la technologie de génération de mondes accessible à un plus grand nombre d’utilisateurs

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.