RLama - DocumentAI open source avec Ollama
(rlama.dev)- Un outil de questions-réponses basé sur l’IA pour les documents, utilisé en connexion avec des modèles Ollama locaux
- Permet de créer, gérer et utiliser un système RAG (Retrieval-Augmented Generation) adapté aux besoins de documentation
- Disponible sur macOS, Linux et Windows
- Indexation de dossiers de documents : permet d’indexer des dossiers de documents pour une recherche et des requêtes intelligentes, avec prise en charge de nombreux formats comme le texte, le code, les PDF et les DOCX
- Traitement local : toutes les données sont traitées localement à l’aide de modèles Ollama, sans fuite de données vers l’extérieur
- Sessions RAG interactives : permet de créer des sessions interactives pour interroger une base de connaissances documentaire
- Simplicité de gestion : fournit des commandes simples pour créer, lister et supprimer des systèmes RAG
- Pensé pour les développeurs : conçu en Go pour les développeurs et les utilisateurs techniques
1 commentaires
Avis Hacker News
Ce système n’utilise pas de découpage en chunks pour les documents et envoie le document entier à Ollama pour la requête d’embedding. Il n’est donc utile que lorsque le document est petit
Il est recommandé d’afficher les résultats de recherche à l’utilisateur. Un moteur de recherche vectorielle seul est déjà très utile
Quelques notes rapides, tout en saluant le projet
Note sur le code : étonnant que
.ts(typescript) ne soit pas dans la listeLe site web est très propre. Je me demande s’il a été codé de zéro ou s’il repose sur un template
Il est très facile de créer son propre RAG. Ollama propose un tutoriel de démarrage rapide. On peut ajuster le processus selon ses besoins
Je reste sceptique sur l’utilité de ce type d’outils. Avec les problèmes d’hallucination, je me demande à quel point ils sont fiables et s’ils citent correctement leurs sources
Il n’y a aucune information sur l’architecture / la stack technique de ce projet. Rien non plus dans le readme GitHub ni sur le site web
En tant qu’historien amateur, je scanne des documents dans des archives et je les stocke en fichiers JPG. Je me demande quelle est la meilleure façon d’exploiter cet ensemble de connaissances
Je me demande si cela peut fonctionner avec llama.cpp, qui est le moteur d’Ollama
Ce serait bien d’avoir une interface API pour pouvoir l’intégrer à d’autres systèmes
Beau projet. Je me demande sous quelle licence il est publié. Ce n’est pas documenté
Je suis curieux des performances du RAG. Il ne suffit pas de jeter une base de données vectorielle dedans pour que ce soit utile