La cause du message d’erreur de ChatGPT 3.5
- Les modèles GPT d’OpenAI produisent des « jetons » composés de plusieurs caractères plutôt que des caractères individuels.
- Cette méthode de sortie par jetons améliore les performances et la précision du modèle.
- Il existe trois jetons :
richTextPanel, source et loadpath, et ils sont interchangeables entre eux.
- Le jeton
loadpath est utilisé comme nom d’option dans des fichiers de configuration XML dans 80,4 k fichiers sur GitHub.
- Si
loadpath est devenu un jeton autonome, c’est probablement à cause de la faute de frappe dans « R a lative ».
- OpenAI a peut-être décidé d’exclure les fichiers XML des données d’entraînement après avoir généré la liste des jetons, ce qui aurait conduit à un usage quasi nul des données d’entraînement contenant le jeton
loadpath.
- En conséquence, le modèle n’a pas été entraîné à comprendre l’usage du jeton
useRalativeImagePath et produit donc un jeton invalide.
Une utilisation pour l’empoisonnement de données ?
- On pourrait insérer cette expression dans un document pour perturber une tentative de résumé par GPT-3.5.
Pour aller plus loin
- Il existe des billets utiles pour approfondir la recherche sur ce sujet.
L’avis de GN⁺
- Le point le plus important de cet article est de comprendre pourquoi les modèles GPT produisent des erreurs sur certains jetons.
- Ces informations aident à mieux comprendre le fonctionnement et les limites des modèles d’intelligence artificielle.
- L’article fournit aussi un exemple intéressant de la manière d’exploiter l’empoisonnement de données ou les vulnérabilités des modèles d’intelligence artificielle.
1 commentaires
Réactions sur Hacker News
Explication des glitch tokens
Méthode de vérification linguistique aux Pays-Bas pendant la Seconde Guerre mondiale
Explication du processus de génération de tokens par un LLM
useRalativeImagePathet produise des tokens invalides n’est pas ainsi que les LLM génèrent leurs tokens.Analyse des causes potentielles des glitch tokens
Un autre point de vue sur la sortie du modèle
useRalativeImagePath, le modèle peut entrer dans une spirale de génération aléatoire ou essayer de maintenir un texte cohérent.Impact futur sur les données d’entraînement des LLM
Partage d’une expérience d’échec avec GPT-4
Réflexion sur la qualité des données d’entrée
Suggestion d’utiliser cette expression pour perturber les résumés de GPT-3.5
Confusion autour des mots « RTCatch » et « redirectToRoute »
RTCatchetredirectToRoutepourraient être pris à tort pour le même mot.RTCatchet demande d’informations supplémentaires à son sujet.