35 points par xguru 2025-01-15 | 3 commentaires | Partager sur WhatsApp
  • Une interface conviviale pour la QA basée sur le RAG (génération augmentée par récupération)
  • Conçu pour les utilisateurs généraux qui veulent effectuer de la QA sur des documents et pour les développeurs qui souhaitent construire leur propre pipeline RAG
  • Prise en charge de divers LLM : fournisseurs d’API LLM comme OpenAI, AzureOpenAI, Cohere, ainsi que des LLM locaux (ollama, llama-cpp-python)
  • Installation simple : script fourni pour démarrer rapidement
  • Possibilité de tester son propre pipeline RAG avec une interface créée avec Gradio (thèmes fournis)

Fonctionnalités principales

  • Hébergement d’une interface web de QA sur documents :
    • prise en charge de la connexion multi-utilisateur
    • organisation des documents en collections privées/publiques
    • partage de l’historique de chat et collaboration possibles
  • Gestion des LLM et des modèles d’embedding :
    • prise en charge des LLM locaux et de fournisseurs d’API populaires comme OpenAI, Azure, Ollama, Groq, etc.
  • Pipeline RAG hybride :
    • combine par défaut un moteur de recherche hybride (texte intégral et vecteur) et un reranking pour garantir la meilleure qualité de recherche
  • Prise en charge de la QA multimodale :
    • possibilité de répondre à des questions sur plusieurs documents incluant des schémas et des tableaux
    • possibilité de sélectionner dans l’UI les options de parsing de documents multimodaux
  • Citations avancées et aperçu des documents :
    • fournit des informations de citation détaillées pour garantir la précision
    • permet de vérifier les citations et les scores associés avec surlignage dans un visualiseur PDF intégré au navigateur
    • affiche un avertissement lorsqu’un document peu pertinent est renvoyé
  • Prise en charge de méthodes de raisonnement complexes :
    • permet de répondre à des questions complexes ou en plusieurs étapes via la décomposition de questions
    • prise en charge du raisonnement basé sur des agents avec ReAct, ReWOO et d’autres agents
  • UI de configuration personnalisable :
    • possibilité d’ajuster directement dans l’UI les éléments clés des processus de recherche et de génération (par ex. les paramètres de prompt)
  • Extensible :
    • construit sur Gradio, ce qui permet de personnaliser librement les éléments d’interface
    • prise en charge prévue de diverses stratégies d’indexation et de recherche de documents. Un pipeline d’indexation GraphRAG est fourni comme exemple

3 commentaires

 
riskatcher 2025-01-16

Il y a tellement de frameworks QA RAG, quels sont les avantages de celui-ci ?

 
savvykang 2025-01-15

Dans le domaine de la recherche d’information, et dans l’explication, QA ne signifie pas quality assurance mais question answering.

 
sftblw 2025-01-15

Le nom est amusant. À en juger uniquement par le nom, je me dis que c’est peut-être kotae (réponse) + Doraemon (mon), donc Kotaemon.