Le nouvel outil File Search lancé dans l’API Gemini de Google simplifie de façon radicale la mise en place d’un système RAG (Retrieval-Augmented Generation) :
- Au lieu du pipeline complexe habituel avec chunking, embeddings et configuration d’une base de données vectorielle, un simple envoi de fichier (2 lignes de code) déclenche le traitement automatique, puis les documents pertinents sont retrouvés à la requête et injectés dans le modèle.
- Le stockage et les embeddings de requête sont gratuits ; seul le coût d’indexation initial s’applique, à 0,15 $ par million de tokens.
- Fichiers pris en charge : PDF, DOCX, TXT, etc.
- En situation réelle, la recherche sur 3 000 fichiers est traitée en 2 secondes, ce qui réduit fortement le temps de développement des prototypes.
- Fonctionnalités supplémentaires : citations automatiques, filtrage par métadonnées, etc.
- Limites : 10 stores maximum par projet, niveau gratuit limité à 1 Go.
- Bilan : le seuil d’entrée du développement RAG baisse, ce qui permet de se concentrer sur l’application.
3 commentaires
C’est bien du Google.
Merci pour le partage. La qualité ! Je suis vraiment curieux.
En voyant que NotebookLM était proposé comme service, je me disais qu’un jour ça sortirait peut-être sous une forme de type API NotebookLM, et voilà que c’est lancé comme service d’API appelé File Search, incroyable.
J’avais clairement senti qu’il y avait un certain obstacle à franchir pour bien faire du RAG, entre construire un pipeline/workflow, lancer Ollama et tester différents modèles, donc si la qualité est garantie à un certain niveau (il faudra l’essayer pour le savoir), ce sera vraiment très pratique à utiliser.