Des prompts plus concis donnent de meilleurs résultats avec GPT
- GPT est au contraire facilement perturbé quand on explicite de façon excessive dans le prompt des éléments qu’il connaît déjà comme du bon sens
- Par exemple, pour une tâche de classification de l’État (
state) mentionné dans un texte, demander simplement le nom de l’État donne de meilleurs résultats que de fournir la liste des 50 États
L’API chat d’OpenAI suffit à elle seule pour implémenter des fonctionnalités variées et puissantes
- Même sans outils supplémentaires comme Langchain, il est possible d’implémenter simplement les fonctions nécessaires, comme l’extraction de JSON, en utilisant uniquement l’API chat
- Lors d’une mise à niveau du modèle GPT, il suffit de modifier une seule chaîne de caractères dans la base de code
- Il suffit aussi d’ajouter une logique simple pour la gestion des erreurs de l’API OpenAI et les limites de longueur d’entrée
Il est difficile de gérer les cas où GPT ne trouve rien
- Avec un prompt du type « si tu ne trouves rien, renvoie une valeur vide », GPT invente souvent quelque chose ou manque de confiance
- La solution consiste à ne pas envoyer de prompt à GPT quand l’entrée est vide
GPT ne peut générer qu’une sortie de longueur limitée
- La limite d’entrée de GPT-4 est de 128k tokens, mais sa limite de sortie n’est que de 4k tokens
- Lorsqu’on demande une liste d’objets JSON, GPT a du mal à générer de façon fiable plus de 10 éléments
Les bases de données vectorielles, RAG et les embeddings n’aident pas beaucoup pour les usages généraux
- En dehors de la recherche, RAG fonctionne mal
- Leur utilité pratique est limitée en raison de la difficulté d’évaluer la pertinence, des problèmes d’isolation des données et d’une baisse de la satisfaction des utilisateurs
- Pour la recherche générale, une recherche à facettes avec GPT ou la génération de requêtes complexes sont plus adaptées
GPT ne produit pratiquement pas d’hallucinations
- Pour les tâches d’extraction d’informations à partir d’un texte donné, GPT fournit des résultats très fiables
- En revanche, si l’information n’est pas présente dans le texte, il peut inventer quelque chose
- Il est donc important de fournir suffisamment de contexte et de bien gérer les réponses de GPT
Avis de GN⁺
- Il semble difficile d’atteindre l’AGI avec les seuls modèles Transformer, les données du web et une infrastructure à grande échelle
- GPT-4 est clairement utile, mais pour aller plus loin, une innovation dans l’architecture même des modèles semble nécessaire
- Les alternatives à OpenAI ne semblent pas encore au niveau de GPT, et il faudra finalement surtout surveiller les nouvelles versions de GPT
- Les performances de GPT-5 ne devraient probablement pas être révolutionnaires par rapport à GPT-4. Le rapport coût/efficacité semble atteindre ses limites
- En conséquence, il paraît plus réaliste pour le moment de se concentrer sur la meilleure conception de prompts et sur les applications autour de GPT-4
1 commentaires
Avis Hacker News
null: