- Un guide qui partage des stratégies et des techniques pour obtenir de meilleurs résultats avec les grands modèles de langage (également appelés modèles GPT)
- Les méthodes décrites ici peuvent parfois être combinées pour produire un effet plus important, et il est recommandé d’expérimenter afin de trouver l’approche la plus adaptée
- Vous pouvez explorer les prompts d’exemple pour découvrir ce que le modèle est capable de faire
Six stratégies pour obtenir de meilleurs résultats
Rédiger des instructions claires
- Le modèle ne peut pas lire dans vos pensées, il faut donc demander clairement ce que vous voulez.
- Incluez des détails pour obtenir des réponses plus pertinentes, demandez au modèle d’incarner un personnage précis ou utilisez des délimiteurs pour indiquer clairement les différentes parties de l’entrée.
- Précisez les étapes nécessaires pour accomplir la tâche, fournissez des exemples et indiquez la longueur souhaitée de la sortie.
Fournir un texte de référence
- Les modèles de langage peuvent produire avec assurance de fausses réponses, en particulier lorsqu’on leur demande des sujets obscurs, des citations ou des URL.
- Demandez au modèle de répondre en utilisant un texte de référence, ou de répondre en citant ce texte de référence.
Diviser les tâches complexes en sous-tâches simples
- De même qu’il est bon, en ingénierie logicielle, de décomposer un système complexe en composants modulaires, il en va de même pour les tâches soumises à un modèle de langage.
- Les tâches complexes ont un taux d’erreur plus élevé et peuvent souvent être redéfinies comme un workflow de tâches simples.
- Utilisez la classification d’intention pour identifier les instructions les plus pertinentes pour la requête de l’utilisateur et, pour les applications conversationnelles nécessitant des échanges très longs, résumez ou filtrez les conversations précédentes.
- Résumez les longs documents par morceaux, puis construisez récursivement un résumé global.
Donner au modèle le temps de « réfléchir »
- Si vous demandez une « chaîne de pensée » au modèle avant qu’il ne rédige sa réponse, au lieu de le pousser à répondre dans la précipitation, vous pouvez obtenir des réponses plus fiables.
- Demandez au modèle d’élaborer d’abord sa propre solution, puis utilisez un monologue interne ou une série de requêtes pour masquer son processus de raisonnement.
- Demandez au modèle s’il a manqué quelque chose lors d’un passage précédent.
Utiliser des outils externes
- Fournissez au modèle la sortie d’autres outils pour compenser ses faiblesses.
- Mettez en place une recherche de connaissances efficace avec une recherche basée sur les embeddings, utilisez l’exécution de code pour des calculs plus précis ou appelez des API externes.
- Autorisez le modèle à accéder à des fonctions spécifiques.
Tester systématiquement les changements
- Il est plus facile d’améliorer les performances lorsqu’elles sont mesurables.
- Il est nécessaire de définir une suite de tests complète (ou « eval ») pour vérifier si les changements ont un impact positif sur les performances globales.
- Évaluez la sortie du modèle en la comparant à une réponse de référence.
L’avis de GN⁺
- Le point le plus important : le prompt engineering est une méthode essentielle pour optimiser les performances des modèles de langage, en fournissant des consignes précises qui permettent de bien cerner l’intention de l’utilisateur et d’obtenir le résultat souhaité.
- Pourquoi c’est intéressant : ces stratégies rendent l’usage des modèles de langage d’IA plus efficace et permettent d’obtenir de meilleures performances, en particulier avec les modèles récents comme GPT-4.
- Point notable : ce guide propose des exemples concrets et des stratégies qui aident à résoudre les problèmes courants rencontrés par les ingénieurs logiciels débutants lorsqu’ils utilisent des modèles de langage, et montre comment mieux exploiter ces modèles dans des tâches réelles.
2 commentaires
Bonnes pratiques d’OpenAI pour GPT : aperçu. 6 stratégies de rédaction de prompts pour obtenir de meilleures réponses
Avis sur Hacker News
Discussion sur le prompt système de ChatGPT
Retour d’expérience sur une commande de cheeseburger en espagnol
Discussion sur les caractéristiques des LLM (Large Language Models)
Réticence à investir dans l’apprentissage de la rédaction de prompts
Comparaison entre le prompt engineering et les requêtes de recherche avancée sur Google
Comparaison entre les prompts pour Google Search et pour les LLM
Échecs de communication entre humains et limites des LLM
Critique du terme « prompt engineering »
Le rôle des LLM pour apprendre aux humains à communiquer clairement
Facilité d’implémentation d’applications de chat fondées sur les LLM