55 points par davespark 2025-11-10 | 3 commentaires | Partager sur WhatsApp

Le nouvel outil File Search lancé dans l’API Gemini de Google simplifie de façon radicale la mise en place d’un système RAG (Retrieval-Augmented Generation) :

  • Au lieu du pipeline complexe habituel avec chunking, embeddings et configuration d’une base de données vectorielle, un simple envoi de fichier (2 lignes de code) déclenche le traitement automatique, puis les documents pertinents sont retrouvés à la requête et injectés dans le modèle.
  • Le stockage et les embeddings de requête sont gratuits ; seul le coût d’indexation initial s’applique, à 0,15 $ par million de tokens.
  • Fichiers pris en charge : PDF, DOCX, TXT, etc.
  • En situation réelle, la recherche sur 3 000 fichiers est traitée en 2 secondes, ce qui réduit fortement le temps de développement des prototypes.
  • Fonctionnalités supplémentaires : citations automatiques, filtrage par métadonnées, etc.
  • Limites : 10 stores maximum par projet, niveau gratuit limité à 1 Go.
  • Bilan : le seuil d’entrée du développement RAG baisse, ce qui permet de se concentrer sur l’application.

3 commentaires

 
kaydash 2025-11-11

C’est bien du Google.

 
dkmin 2025-11-10

Merci pour le partage. La qualité ! Je suis vraiment curieux.

 
unknowncyder 2025-11-10

En voyant que NotebookLM était proposé comme service, je me disais qu’un jour ça sortirait peut-être sous une forme de type API NotebookLM, et voilà que c’est lancé comme service d’API appelé File Search, incroyable.

J’avais clairement senti qu’il y avait un certain obstacle à franchir pour bien faire du RAG, entre construire un pipeline/workflow, lancer Ollama et tester différents modèles, donc si la qualité est garantie à un certain niveau (il faudra l’essayer pour le savoir), ce sera vraiment très pratique à utiliser.