FLAMEHAVEN FileSearch v1.3.1 – suppression des dépendances ML et refonte majeure du moteur de recherche sémantique
(github.com/flamehaven01)FLAMEHAVEN FileSearch est un projet open source né de la question suivante :
👉 « Peut-on rendre un RAG de recherche documentaire léger, reproductible et entièrement self-hosted ? »
Le projet compte actuellement ⭐ 81 stars / 🍴 11 forks. Modeste en taille, il a toutefois continué à apporter des améliorations nettes à chaque release.
Cette release v1.3.1 n’est pas une simple addition de fonctionnalités :
👉 c’est une mise à jour qui fait voler en éclats l’idée selon laquelle « recherche sémantique = stack ML lourde ».
🔍 Résumé du projet en une ligne
-
Moteur de recherche RAG self-hosted
-
Upload de documents (PDF/DOCX/MD/TXT) avec recherche par mots-clés + sémantique + hybride
-
Fonctionne en local sans base de données vectorielle externe
-
Exécutable en moins de 3 minutes avec une seule ligne Docker
✨ Principales nouveautés de la v1.3.1 (les points que les développeurs vont apprécier)
1️⃣ Suppression complète des dépendances ML (le plus grand changement)
-
Suppression totale de
sentence-transformers/torch -
Introduction de DSP v2.0 (Deterministic Semantic Projection), implémenté en interne
-
✔️ génération de vecteurs < 1 ms
-
✔️ aucun délai d’initialisation (avant : 2 minutes → immédiat)
-
Une recherche sémantique déterministe, sans framework ML
2️⃣ Optimisations mémoire et performances
-
Quantification des vecteurs en int8
→ 75 % de réduction de l’usage mémoire -
Plus de 30 % de gain de vitesse sur le calcul de similarité cosinus
-
Compression de plus de 90 % des métadonnées (Gravitas-Pack)
-
Exploitable sans difficulté sur un serveur personnel ou une VM d’entreprise
3️⃣ Extension des modes de recherche
-
Prise en charge des modes keyword / semantic / hybrid
-
Inclut la correction de fautes de frappe + le raffinement des requêtes
-
API existante entièrement backward-compatible
4️⃣ Stabilité et fiabilité
-
Migration du framework de test de pytest vers unittest
-
19/19 tests validés (0.33s)
-
Suppression des timeouts et de l’instabilité CI
🔐 Fonctionnalités de production toujours présentes
-
Authentification et gestion des permissions via API Key
-
Rate limiting / Audit log
-
Batch search (1 à 100 requêtes)
-
Cache Redis optionnel
-
Métriques Prometheus
👀 Particulièrement adapté pour
-
Les équipes qui ont besoin d’un RAG local pour la recherche dans des documents internes
-
Les environnements où il est difficile d’envoyer les données vers un SaaS externe (Pinecone, etc.)
-
Les développeurs arrivés à l’étape : « Le PoC fonctionne, mais comment on l’exploite en production ? »
-
Les ingénieurs qui privilégient la reproductibilité, les coûts maîtrisés et le contrôle
🔗 GitHub
👉 https://github.com/flamehaven01/Flamehaven-Filesearch
---N’hésitez pas à l’essayer, et si cela vous a aidé, un ⭐ ferait vraiment plaisir.
Tous les avis, retours et PR sont les bienvenus.
Aucun commentaire pour le moment.