Comment fournir un ensemble de documents personnalisé à un LLM
- Discussion sur la meilleure façon de fournir à un LLM (Large Language Models) un ensemble de documents utilisateur afin d’obtenir des réponses pertinentes sans résultats irréalistes.
- L’accent est mis sur les méthodes permettant d’« enseigner » à un LLM un ensemble de documents spécifique. Cela ne signifie pas nécessairement entraîner son propre modèle, et inclut aussi des approches comme le RAG (Retrieval-Augmented Generation).
- Il existe un fil de discussion datant d’il y a 5 mois, mais des informations adaptées à la situation de décembre 2023 sont nécessaires.
L’avis de GN⁺
- L’extraction d’informations précises à partir d’un ensemble de documents spécifique à l’aide d’un LLM devient de plus en plus importante avec les progrès de la technologie.
- Ces techniques aident à obtenir des résultats personnalisés selon les besoins de l’utilisateur, avec des applications possibles dans la business intelligence, la recherche, l’éducation et bien d’autres domaines.
- Il est important d’exploiter des approches existantes comme le RAG ou d’explorer de nouvelles méthodes, ce qui contribuera à améliorer l’usage des LLM et à obtenir des résultats plus précis et plus fiables.
1 commentaires
Commentaires sur Hacker News
Il n’y a pas réellement d’entraînement sur les documents ; beaucoup de startups utilisent ce terme, mais en pratique elles utilisent du RAG (Retrieval-Augmented Generation).
Il faut envisager des approches différentes selon le volume de documents.
AWS Bedrock est facile à utiliser : on peut téléverser des documents sur S3, les synchroniser avec une base de données vectorielle, puis les exploiter via une API.
h2ogpt est une implémentation RAG complète, capable de traiter des documents de formats variés et de prendre en charge diverses implémentations d’hébergement de modèles.
Il est possible d’acheter un compte ChatGPT et d’y téléverser ses propres documents afin de créer une IA conversationnelle personnalisée.
Les GPT4 Assistants peuvent désormais gérer le RAG nativement, et PrivateGPT est l’une des options les plus connues pour cela.
Copilot Builder de Microsoft Office permet aux utilisateurs de créer un AI Copilot en quelques secondes en spécifiant une URL de base, des fichiers téléversés, etc.
Cheshire Cat est un framework d’assistant IA qui stocke les documents comme des "souvenirs" afin de pouvoir les retrouver plus tard.
Il existe un guide vidéo expliquant comment fine-tuner Mistral 7B avec QLoRA, tout en précisant que les techniques de RAG peuvent être préférables.