29 points par flamehaven01 2025-11-13 | Aucun commentaire pour le moment. | Partager sur WhatsApp

🔥Flamehaven FileSearch

  • Flamehaven FileSearch est un moteur open source de recherche sémantique auto-hébergeable qui permet à n’importe qui de mettre en place en 5 minutes un système RAG (Retrieval-Augmented Generation) basé sur des documents.
  • Construit sur Python, FastAPI et SQLite, il utilise Google Gemini Embedding pour effectuer des questions-réponses en langage naturel à partir de divers documents comme PDF/DOCX/TXT/MD.

Pourquoi l’avoir créé ?

  • La plupart des implémentations open source de RAG fonctionnent bien dans des environnements Colab ou Jupyter, mais leur structure est souvent trop complexe ou leur stabilité insuffisante pour un déploiement réel sur serveur.
  • Flamehaven FileSearch a été conçu avec pour objectif une « pile RAG légère qui fonctionne réellement », afin que chercheurs, startups et développeurs indépendants puissent expérimenter immédiatement la recherche sémantique sur leurs propres données.

Pourquoi faut-il y prêter attention ?

  • Autonomie totale : aucune dépendance à un serveur externe ou au cloud, toutes les données sont stockées en local.
  • Architecture pensée pour les développeurs : SDK Python + API REST, documentation Swagger fournie automatiquement via FastAPI.
  • Distribution en package PyPI : installation immédiate depuis PyPI — installation entièrement automatisée en une seule ligne avec pip install flamehaven-filesearch[api].
  • Exécution immédiate : après l’installation, le serveur se lance directement avec la commande flamehaven-api, et l’API peut être testée dans le navigateur via /docs.
  • Extensibilité : stockage SQLite, architecture à plugins, prise en charge du déploiement Docker.
  • Adapté à l’enseignement et à la recherche : utilise les embeddings Gemini, idéal pour des travaux pratiques de recherche sémantique fondée sur les LLM les plus récents.

Que contient-il ? (points forts)

  • SDK Python : from flamehaven_filesearch import FlamehavenFileSearch

    → fournit toutes les fonctions d’upload de documents, de recherche et de gestion des stores.

  • API REST : endpoints /upload, /search, /stores + interface Swagger UI.

  • Prise en charge de Docker : docker run -e GEMINI_API_KEY=... -p 8000:8000 flamehaven/filesearch:latest

  • Structure : core(moteur) / api(FastAPI) / data(SQLite) / examples / docs


Essai rapide

1️⃣ Package PyPI

Flamehaven FileSearch peut être installé directement via PyPI.

Dernière version : https://pypi.org/project/flamehaven-filesearch

pip install flamehaven-filesearch[api]  

2️⃣ Installation

pip install flamehaven-filesearch[api]  
export GEMINI_API_KEY="your-google-gemini-key"  
flamehaven-api  
  

3️⃣ Upload de documents et recherche

curl -X POST "http://localhost:8000/upload"; -F "file=@handbook.pdf"  
curl "http://localhost:8000/search?q=vacation+policy";  
  

4️⃣ Exemple d’utilisation du SDK

from flamehaven_filesearch import FlamehavenFileSearch  
fs = FlamehavenFileSearch()  
fs.upload_file("handbook.pdf")  
print(fs.search("vacation policy")["answer"])  
  

Performances & spécifications

  • Environnement : Ubuntu 22.04 / 2vCPU / 4GB RAM / SSD
  • Upload d’un PDF de 10MB → environ 5 secondes
  • Temps de réponse moyen en recherche → 2 secondes (avec citation de 5 sources)
  • Suppression/création de store → moins d’1 seconde
  • Surcharge de stockage → environ 5 % de la taille du document

Feuille de route

  • v1.1 : gestion du cache et des quotas
  • v1.2 : recherche par lots + streaming WebSocket
  • v2.0 : prise en charge des documents multilingues, tableau de bord analytique
  • À venir : intégration de bases vectorielles Pinecone/Weaviate, OCR, stores collaboratifs

Licence

  • Licence MIT (entièrement open source)

🛡️ Avis de sécurité GitHub et de compte Flamehaven

Des tentatives de connexion suspectes ont récemment été détectées sur le compte GitHub Flamehaven (ce compte), ce qui a conduit à sa suspension. Le problème est actuellement en cours de vérification avec l’équipe de sécurité de GitHub.

À la suite de cet incident, les comptes comprenant notamment dir2md, flashrecord, crom-efficient et Arr-medic-cyp3a4 sont temporairement hors service.

Nous vous présentons nos sincères excuses pour la gêne occasionnée et vous remercions de votre compréhension jusqu’à la fin des vérifications de sécurité.

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.