3 points par GN⁺ 2025-12-08 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • GPTZero a détecté plus de 50 erreurs de citation et informations d’auteur erronées dans les soumissions de l’ICLR 2026
  • Chaque article a été vérifié avec son lien OpenReview pour confirmer son existence réelle et la correspondance des citations
  • De nombreux cas contenaient des auteurs inexistants, des années incorrectes et des titres de papier différents
  • Certains articles correspondent partiellement à des travaux réels, mais leurs métadonnées détaillées sont déformées
  • Il s’agit d’exemples montrant que le problème de hallucination générée par l’IA s’étend aussi aux soumissions académiques

Résultats de détection de GPTZero sur les soumissions ICLR 2026

  • GPTZero a vérifié de manière automatique les citations et les informations d’auteur des soumissions à l’ICLR 2026
    • Chaque document est accompagné d’un lien OpenReview, d’un lien de vérification GPTZero et de ses données de citation
    • Les résultats de validation montrent que plus de 50 cas comportent des citations fausses ou des auteurs inexistants

Cas d’hallucination représentatifs

  • Le papier TamperTok existe bien, mais toutes ses informations d’auteur sont incorrectes
  • Pour le papier MixtureVitae, les 3 premiers auteurs coïncident, mais les 7 autres n’existent pas
  • OrtSAE, Principled Policy Optimization, IMPQ et d’autres présentent des discordances de titre ou d’auteurs avec les travaux réels
  • PDMBench a un document similaire existant, mais l’année et le titre diffèrent
  • C3-OWD et GRF-LLM sont classés comme cas de correspondance partielle

Cas de non-correspondance complète

  • Catch-Only-One, TopoMHC, ThinkGeo, Reflexion, LOSI et d’autres citent des documents qui n’existent pas
  • SAFE-LLM, Typed Chain-of-Thought, MANTA et d’autres ont des documents similaires, mais des métadonnées incohérentes
  • AI-Assisted Medical Triage Assistant, QUART, KARMA et d’autres citent des papiers sans aucun lien

Méthode de vérification et types de résultats

  • GPTZero compare chaque citation avec des bases de données réelles (p. ex. arXiv, NeurIPS, ICLR, ACL, etc.)
    • Les résultats sont classés en “présent”, “partiel”, “non conforme” et “auteur erroné”
    • Certaines entrées sont signalées comme des cas où un vrai document existe, mais avec des auteurs, une année et un titre tous différents

Signification et implications

  • De nombreuses soumissions de l’ICLR 2026 intègrent directement des hallucinations issues de texte généré par l’IA
  • Même lors de la rédaction académique, la nécessité d’outils d’automatisation de vérification factuelle devient évidente
  • Les résultats de GPTZero montrent la nécessité de renforcer les systèmes de vérification de la fiabilité des contenus générés par l’IA

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.