Les limites du RAG, et GraphRAG comme l’une des approches pour les surmonter

hankor · 2024-08-05T17:13:39+09:00

L’ère de ChatGPT est arrivée. Nous vivons aujourd’hui à une époque où l’influence des grands modèles de langage est telle qu’on pourrait parler d’une troisième révolution industrielle. Même ma mère utilise ChatGPT lorsqu’elle a des questions, preuve que son champ d’utilisation s’élargit de plus en plus, au-delà des générations. Si l’on réfléchit à la raison de cet élargissement des usages, c’est sans doute parce que ces outils savent récupérer avec précision les informations que l’utilisateur souhaite et les transmettre efficacement. Pour des personnes fatiguées par la surabondance d’informations, ils sélectionnent bien les informations « nécessaires » et les apportent. Malgré les progrès spectaculaires accomplis jusqu’à présent, de nombreux obstacles subsistent. L’un des exemples les plus connus est ce qu’on appelle les « hallucinations ». L’information est fournie, mais elle est inexacte. Ce phénomène a plusieurs causes. La plus représentative consiste à mal interpréter l’intention de l’utilisateur et à ramener des informations sans rapport. La manière de résoudre cette cause est simple : bien comprendre l’intention de l’utilisateur et fournir des informations « pertinentes ». 4, Pour améliorer cela, diverses tentatives sont en cours. On peut principalement les classer en quatre approches : 1. construire un grand modèle de langage dès le départ ; 2. prendre un grand modèle de langage « bien » entraîné et l’affiner davantage pour l’adapter au domaine souhaité ; 3. utiliser tel quel le grand modèle de langage, mais ajouter un contexte supplémentaire à la requête de l’utilisateur ; 4. conserver le grand modèle de langage, mais pendant le processus de réponse, fournir en plus le contexte d’« informations pertinentes » afin de mettre en avant cette pertinence. Comme les approches sont diverses, leurs avantages et inconvénients le sont aussi. La première a l’avantage de pouvoir présenter dès le départ au grand modèle de langage un contexte clair des données, puisqu’on le construit depuis zéro. En revanche, son inconvénient est que le coût de construction est loin d’être négligeable. 2 présente l’avantage d’être relativement moins coûteuse et de garantir un certain niveau de précision, car elle s’appuie sur le contexte d’un grand modèle de langage « bien » entraîné et y applique de manière ciblée une petite quantité de données spécialisées du domaine. En revanche, il est difficile de conserver le contexte du grand modèle de langage tout en maintenant harmonieusement un contexte spécifique au domaine. 3 a pour avantage d’être peu coûteuse, puisqu’il suffit de bien enrichir la requête utilisateur avec un contexte lié à l’intention. En revanche, dans ce processus d’ajout de contexte, la subjectivité de la personne qui fournit ce contexte peut intervenir, ce qui peut nuire à son objectivité ; si un biais est fortement reflété, le contexte peut même avoir un effet négatif. 4 présente l’avantage de pouvoir répondre aux requêtes des utilisateurs avec des réponses intégrant des informations relativement récentes, tout en ayant un coût d’adoption faible. En revanche, comme la qualité des questions varie fortement selon les documents pertinents, il faut aborder de manière stratégique la façon d’identifier et de récupérer correctement ces documents, en combinant de façon équilibrée divers éléments, ce qui accroît fortement la complexité. Par ailleurs, une comparaison détaillée selon cinq dimensions — cost, accuracy, domain-specific terminology, up-to-date response, transparency and interpretability — est très bien documentée ici : https://deci.ai/blog/… ; je vous recommande d’y jeter un œil. Jusqu’ici, nous avons parlé de plusieurs méthodologies essayant de résoudre le problème des hallucinations dans les grands modèles de langage. Dans ce billet, nous allons examiner le RAG (Retrieval Augment Generation), une technique qui consiste à bien récupérer les « informations pertinentes » afin de fournir du contexte, puis nous verrons les limites du RAG ainsi que GraphRAG, l’une des approches proposées pour compenser ces limites.

(inblog.ai)

7 points par hankor 2024-08-05 | Aucun commentaire pour le moment. | Partager sur WhatsApp

L’ère de ChatGPT est arrivée. Nous vivons aujourd’hui à une époque où l’influence des grands modèles de langage est telle qu’on pourrait parler d’une troisième révolution industrielle. Même ma mère utilise ChatGPT lorsqu’elle a des questions, preuve que son champ d’utilisation s’élargit de plus en plus, au-delà des générations.
Si l’on réfléchit à la raison de cet élargissement des usages, c’est sans doute parce que ces outils savent récupérer avec précision les informations que l’utilisateur souhaite et les transmettre efficacement. Pour des personnes fatiguées par la surabondance d’informations, ils sélectionnent bien les informations « nécessaires » et les apportent.
Malgré les progrès spectaculaires accomplis jusqu’à présent, de nombreux obstacles subsistent. L’un des exemples les plus connus est ce qu’on appelle les « hallucinations ». L’information est fournie, mais elle est inexacte. Ce phénomène a plusieurs causes. La plus représentative consiste à mal interpréter l’intention de l’utilisateur et à ramener des informations sans rapport. La manière de résoudre cette cause est simple : bien comprendre l’intention de l’utilisateur et fournir des informations « pertinentes ».
4, Pour améliorer cela, diverses tentatives sont en cours. On peut principalement les classer en quatre approches : 1. construire un grand modèle de langage dès le départ ; 2. prendre un grand modèle de langage « bien » entraîné et l’affiner davantage pour l’adapter au domaine souhaité ; 3. utiliser tel quel le grand modèle de langage, mais ajouter un contexte supplémentaire à la requête de l’utilisateur ; 4. conserver le grand modèle de langage, mais pendant le processus de réponse, fournir en plus le contexte d’« informations pertinentes » afin de mettre en avant cette pertinence. Comme les approches sont diverses, leurs avantages et inconvénients le sont aussi.
La première a l’avantage de pouvoir présenter dès le départ au grand modèle de langage un contexte clair des données, puisqu’on le construit depuis zéro. En revanche, son inconvénient est que le coût de construction est loin d’être négligeable.
2 présente l’avantage d’être relativement moins coûteuse et de garantir un certain niveau de précision, car elle s’appuie sur le contexte d’un grand modèle de langage « bien » entraîné et y applique de manière ciblée une petite quantité de données spécialisées du domaine. En revanche, il est difficile de conserver le contexte du grand modèle de langage tout en maintenant harmonieusement un contexte spécifique au domaine.
3 a pour avantage d’être peu coûteuse, puisqu’il suffit de bien enrichir la requête utilisateur avec un contexte lié à l’intention. En revanche, dans ce processus d’ajout de contexte, la subjectivité de la personne qui fournit ce contexte peut intervenir, ce qui peut nuire à son objectivité ; si un biais est fortement reflété, le contexte peut même avoir un effet négatif.
4 présente l’avantage de pouvoir répondre aux requêtes des utilisateurs avec des réponses intégrant des informations relativement récentes, tout en ayant un coût d’adoption faible. En revanche, comme la qualité des questions varie fortement selon les documents pertinents, il faut aborder de manière stratégique la façon d’identifier et de récupérer correctement ces documents, en combinant de façon équilibrée divers éléments, ce qui accroît fortement la complexité.
Par ailleurs, une comparaison détaillée selon cinq dimensions — cost, accuracy, domain-specific terminology, up-to-date response, transparency and interpretability — est très bien documentée ici : https://deci.ai/blog/… ; je vous recommande d’y jeter un œil.
Jusqu’ici, nous avons parlé de plusieurs méthodologies essayant de résoudre le problème des hallucinations dans les grands modèles de langage. Dans ce billet, nous allons examiner le RAG (Retrieval Augment Generation), une technique qui consiste à bien récupérer les « informations pertinentes » afin de fournir du contexte, puis nous verrons les limites du RAG ainsi que GraphRAG, l’une des approches proposées pour compenser ces limites.

Les limites du RAG, et GraphRAG comme l’une des approches pour les surmonter

À lire aussi

Aucun commentaire pour le moment.