- GPTZero a détecté plus de 50 erreurs de citation et informations d’auteur erronées dans les soumissions de l’ICLR 2026
- Chaque article a été vérifié avec son lien OpenReview pour confirmer son existence réelle et la correspondance des citations
- De nombreux cas contenaient des auteurs inexistants, des années incorrectes et des titres de papier différents
- Certains articles correspondent partiellement à des travaux réels, mais leurs métadonnées détaillées sont déformées
- Il s’agit d’exemples montrant que le problème de hallucination générée par l’IA s’étend aussi aux soumissions académiques
Résultats de détection de GPTZero sur les soumissions ICLR 2026
- GPTZero a vérifié de manière automatique les citations et les informations d’auteur des soumissions à l’ICLR 2026
- Chaque document est accompagné d’un lien OpenReview, d’un lien de vérification GPTZero et de ses données de citation
- Les résultats de validation montrent que plus de 50 cas comportent des citations fausses ou des auteurs inexistants
Cas d’hallucination représentatifs
- Le papier TamperTok existe bien, mais toutes ses informations d’auteur sont incorrectes
- Pour le papier MixtureVitae, les 3 premiers auteurs coïncident, mais les 7 autres n’existent pas
- OrtSAE, Principled Policy Optimization, IMPQ et d’autres présentent des discordances de titre ou d’auteurs avec les travaux réels
- PDMBench a un document similaire existant, mais l’année et le titre diffèrent
- C3-OWD et GRF-LLM sont classés comme cas de correspondance partielle
Cas de non-correspondance complète
- Catch-Only-One, TopoMHC, ThinkGeo, Reflexion, LOSI et d’autres citent des documents qui n’existent pas
- SAFE-LLM, Typed Chain-of-Thought, MANTA et d’autres ont des documents similaires, mais des métadonnées incohérentes
- AI-Assisted Medical Triage Assistant, QUART, KARMA et d’autres citent des papiers sans aucun lien
Méthode de vérification et types de résultats
- GPTZero compare chaque citation avec des bases de données réelles (p. ex. arXiv, NeurIPS, ICLR, ACL, etc.)
- Les résultats sont classés en “présent”, “partiel”, “non conforme” et “auteur erroné”
- Certaines entrées sont signalées comme des cas où un vrai document existe, mais avec des auteurs, une année et un titre tous différents
Signification et implications
- De nombreuses soumissions de l’ICLR 2026 intègrent directement des hallucinations issues de texte généré par l’IA
- Même lors de la rédaction académique, la nécessité d’outils d’automatisation de vérification factuelle devient évidente
- Les résultats de GPTZero montrent la nécessité de renforcer les systèmes de vérification de la fiabilité des contenus générés par l’IA
Aucun commentaire pour le moment.