2 points par flamehaven01 2025-12-19 | Aucun commentaire pour le moment. | Partager sur WhatsApp

FLAMEHAVEN FileSearch est un projet open source né de la question suivante :
👉 « Peut-on rendre un RAG de recherche documentaire léger, reproductible et entièrement self-hosted ? »

Le projet compte actuellement ⭐ 81 stars / 🍴 11 forks. Modeste en taille, il a toutefois continué à apporter des améliorations nettes à chaque release.

Cette release v1.3.1 n’est pas une simple addition de fonctionnalités :
👉 c’est une mise à jour qui fait voler en éclats l’idée selon laquelle « recherche sémantique = stack ML lourde ».


🔍 Résumé du projet en une ligne

  • Moteur de recherche RAG self-hosted

  • Upload de documents (PDF/DOCX/MD/TXT) avec recherche par mots-clés + sémantique + hybride

  • Fonctionne en local sans base de données vectorielle externe

  • Exécutable en moins de 3 minutes avec une seule ligne Docker


✨ Principales nouveautés de la v1.3.1 (les points que les développeurs vont apprécier)
1️⃣ Suppression complète des dépendances ML (le plus grand changement)

  • Suppression totale de sentence-transformers / torch

  • Introduction de DSP v2.0 (Deterministic Semantic Projection), implémenté en interne

  • ✔️ génération de vecteurs < 1 ms

  • ✔️ aucun délai d’initialisation (avant : 2 minutes → immédiat)

  • Une recherche sémantique déterministe, sans framework ML


2️⃣ Optimisations mémoire et performances

  • Quantification des vecteurs en int8
    → 75 % de réduction de l’usage mémoire

  • Plus de 30 % de gain de vitesse sur le calcul de similarité cosinus

  • Compression de plus de 90 % des métadonnées (Gravitas-Pack)

  • Exploitable sans difficulté sur un serveur personnel ou une VM d’entreprise


3️⃣ Extension des modes de recherche

  • Prise en charge des modes keyword / semantic / hybrid

  • Inclut la correction de fautes de frappe + le raffinement des requêtes

  • API existante entièrement backward-compatible


4️⃣ Stabilité et fiabilité

  • Migration du framework de test de pytest vers unittest

  • 19/19 tests validés (0.33s)

  • Suppression des timeouts et de l’instabilité CI


🔐 Fonctionnalités de production toujours présentes

  • Authentification et gestion des permissions via API Key

  • Rate limiting / Audit log

  • Batch search (1 à 100 requêtes)

  • Cache Redis optionnel

  • Métriques Prometheus


👀 Particulièrement adapté pour

  • Les équipes qui ont besoin d’un RAG local pour la recherche dans des documents internes

  • Les environnements où il est difficile d’envoyer les données vers un SaaS externe (Pinecone, etc.)

  • Les développeurs arrivés à l’étape : « Le PoC fonctionne, mais comment on l’exploite en production ? »

  • Les ingénieurs qui privilégient la reproductibilité, les coûts maîtrisés et le contrôle


🔗 GitHub

👉 https://github.com/flamehaven01/Flamehaven-Filesearch

---N’hésitez pas à l’essayer, et si cela vous a aidé, un ⭐ ferait vraiment plaisir.
Tous les avis, retours et PR sont les bienvenus.

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.