1 points par mansuiki 4 시간 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Bonjour. J’ai créé turbo-graph, qui ajoute une couche de mémoire de graphe pour le constrained RAG sur la base de turbovec/TurboQuant.

turbovec est déjà efficace dans les cas de flat top-k ou lorsqu’il existe une allowlist peu coûteuse. Mais dans un vrai système RAG, les requêtes prennent souvent cette forme.

tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates

À chaque fois, il faut reconstruire cette combinaison dans la couche Python/SQL/app, la renvoyer à la recherche vectorielle, reranker les résultats avec le graphe/BM25, puis écrire encore du code pour expliquer pourquoi ces résultats sont sortis.

turbo-graph conserve un cœur compatible avec turbovec, et c’est une expérimentation pour déplacer vers la couche d’indexation la compilation des vues graphe/métadonnées, la réutilisation du cache, le rerank par graphe et la télémétrie d’explication.

C’est encore une version Alpha, donc l’objectif n’est pas tant de recommander un usage immédiat en production que de recueillir des retours sur les API réellement nécessaires dans des routes RAG réelles.

GitHub:
https://github.com/bigmacfive/turbo-graph

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.