(L’article original contient un prompt système, des extraits de code et des GIF)
- Avec la mise à jour de Google AI Studio, un espace a été ajouté pour expérimenter avec diverses mini-apps basées sur Gemini (Starter Apps)
- Il est possible d’exécuter plus de 10 démos en modifiant leur code. Comme elles utilisent une clé Gemini API intégrée, c’est gratuit
- En revanche, si on en abuse, on obtient une erreur 400. Il semble y avoir une limite quotidienne d’appels.
- Ça fonctionne en utilisant un autre compte
Faire une hypothèse : pourquoi Google a-t-il rendu ces démos publiques ?
- Ces derniers temps, Gemini attire l’attention pour ses capacités multimodales, qui vont au-delà du texte pour comprendre et générer aussi des images ou des vidéos, ainsi que pour ses très bonnes compétences en programmation.
- Mais dans la plupart des cas, il est surtout utilisé dans des chatbots LLM, et le grand public l’exploite encore peu au niveau API
- On peut imaginer que Google a présenté ces démos dans l’espoir que ces fonctionnalités soient largement utilisées aussi via l’API, et deviennent une source de revenus
- Toutes les démos servent de vitrine montrant comment implémenter dans une web app, au niveau du code et en combinaison avec d’autres API Google, les différentes capacités de Gemini
Analyse des prompts et du code des démos
J’en ai regardé deux parmi les plus complexes
Video Toys : comprendre et décrire une vidéo + exemple de vibe coding
- Une démo qui analyse une vidéo YouTube avec Gemini 2.5, puis crée en vibe coding une petite app de support pédagogique interactive
- La vidéo est analysée du point de vue d’un « pédagogue et product designer spécialisé dans la création d’expériences éducatives sous forme de web apps interactives », puis la spec de l’app web est produite avant d’être implémentée
- Pour la vidéo d’exemple, le contenu a déjà été analysé, ce qui permet de lancer directement l’app pédagogique
- Contrairement à d’autres démos constituées de quelques fichiers, celle-ci est construite en React
- L’utilisateur peut modifier à la fois la spec de vibe coding générée par Gemini et le code produit
- Recommandé à ceux qui veulent créer des services à partir de vidéos ou des services de génération de code
Maps Planner : exemple multimodal + usage de fonctions + sortie structurée + API cartographique
- Si on lui donne un nom de lieu, la démo le décrit, et en activant le mode Day Planner, elle prépare un itinéraire de voyage sur une journée. Elle estime aussi les temps de trajet
- Les deux modes, General Explorer Mode et Day Planner Mode, sont pris en charge par un seul prompt système
- Il est intéressant de voir que le prompt système est subtilement ajusté selon le mode choisi par l’utilisateur
- Des fonctions sont définies pour lire et écrire correctement les données cartographiques et tracer précisément une ligne entre deux positions, puis Gemini les appelle
- C’est probablement ce type d’extensibilité que MCP cherche à atteindre
- Les prompts sont bons, mais la manière de manipuler l’API cartographique et les données de localisation est également très bien montrée. Recommandé à ceux qui veulent créer des services liés aux cartes
Créer soi-même
- Il est possible de copier les démos et de les personnaliser. Il existe aussi beaucoup de templates pour ceux qui veulent partir de zéro
- J’ai copié une démo de génération d’images appelée Explain Things with Lots of Tiny Cats pour en faire ma propre version
- C’est une démo qui, lorsqu’on lui demande d’expliquer un concept, produit une sorte de webtoon à l’aide de métaphores mettant en scène de nombreux chats
- Le prompt qui pousse à continuer la génération d’images (
No commentary, just begin your explanation. Keep going until you're done.), ainsi que le code qui affiche ces images générées une par une en streaming, m’ont marqué
- Je l’ai adaptée en version coréenne + hippopotames pour créer Les hippopotames savent tout
- J’ai récupéré une police coréenne adaptée sur Google Fonts et légèrement modifié le code HTML ainsi que le prompt
- Il existe une fonction de partage pour son app, mais elle ne marche pas très bien
- Comme tous les fichiers associés sont enregistrés sur Google Drive, il suffit en pratique de les partager directement depuis Google Drive, comme on le ferait pour n’importe quel fichier
Gemini Cookbook
- Alors que les Starter Apps sont surtout des exemples de web apps amusantes, on trouve ici divers exemples en Python
- Il y a même des exemples pour Gemini 2.5 Flash, publiés il y a quelques heures
- Une bonne ressource de référence pour ceux qui veulent créer des services d’IA générative
Aucun commentaire pour le moment.