15 points par davespark 2026-02-23 | 7 commentaires | Partager sur WhatsApp

En s’appuyant sur une étude de la société de sécurité Irregular, l’article souligne que les mots de passe générés par des LLM récents comme Claude, ChatGPT, Gemini paraissent très robustes en surface, mais sont en réalité extrêmement vulnérables.

Principaux résultats de l’expérience

  • La requête « génère-moi un mot de passe » a été répétée 50 fois pour chaque modèle
  • Claude Opus 4.6 : sur 50 essais, 18 ont produit exactement le même mot de passe G7$kL9#mQ2&xP4!w (36 % identiques), avec seulement 30 mots de passe uniques
  • Chaque modèle montre une préférence nette pour certains motifs
    • Claude → commence par « G » + deuxième caractère « 7 »
    • ChatGPT → commence par « v »
    • Gemini → commence par « k » ou « K »
  • Changer la température de 0.0 à 1.0 ne modifie pas beaucoup le résultat (à 0.0, les 50 sorties sont exactement le même mot de passe)

L’illusion d’entropie (d’aléa)

  • Des outils comme KeePass les évaluent comme ayant « environ 100 bits d’entropie, très robuste »
    → cela donne l’impression qu’il faudrait des milliards d’années, même avec un superordinateur
  • Mais le calcul réel de l’entropie de Shannon montre que les mots de passe générés par Claude sont au niveau de 27 bits
    → des mots de passe faibles, cassables en quelques secondes sur un ordinateur ordinaire
  • Exemple avec GPT-5.2 : la probabilité que le 15e caractère soit le chiffre « 2 » est de 99,7 % (presque figé)

Pourquoi les LLM sont inadaptés à la génération de mots de passe

  • Un mot de passe réellement robuste doit être généré par un CSPRNG (générateur de nombres aléatoires cryptographiquement sûr), avec une probabilité uniforme pour chaque caractère
  • Un LLM, au contraire, est entraîné à prédire le token suivant le plus plausible → il maximise donc la prévisibilité
  • → Même avec un bon prompt ou un réglage de la température, le problème de fond ne peut pas être résolu (conclusion d’Irregular)

Un problème plus grave : le risque des agents de codage IA

  • Claude Code, Gemini-CLI, Codex, etc. codent en dur des mots de passe vulnérables dans le code
    Ex. : MariaDB, PostgreSQL, clés API FastAPI, etc.
  • « Génère-moi un mot de passe » → proposition d’une méthode sûre comme openssl rand
    « Recommande-moi un mot de passe » → insertion directe d’un mot de passe à motif généré par le LLM
  • Une recherche sur GitHub de motifs comme K7#mP9, k9#vL permet d’en trouver dans de nombreux dépôts réels

Conclusion

  • Les LLM savent très bien produire des mots de passe qui « ont l’air solides », mais la vraie sécurité dépend non pas de l’apparence, mais de l’entropie réelle et de l’aléa.
  • En raison de leur conception centrée sur la prédiction, les LLM sont structurellement inadaptés à la génération de mots de passe ; et si des outils de codage IA les injectent dans du code, des vulnérabilités peuvent se propager discrètement dans les processus de développement automatisés.

https://aisparkup.com/posts/9480

7 commentaires

 
click 2026-02-23

openssl rand -hex 64 ferait très bien l’affaire ; faut-il vraiment demander à un LLM de générer directement le mot de passe...?
Même quand on demande à une personne de créer un mot de passe, elle le fait souvent d’une manière avec un certain schéma régulier pour pouvoir s’en souvenir facilement.

 
davespark 2026-02-23

Pour les développeurs, ce n’est sans doute pas un gros problème. Mais comme, ces temps-ci, même les non-initiés codent beaucoup avec le vibe coding, je pense que le vrai souci, ce sont davantage les valeurs par défaut qui se retrouvent automatiquement intégrées dans le code. Par exemple, un mot de passe de connexion à la base de données...

 
click 2026-02-23

Quand on pense au fait qu’on a déjà vu pas mal de cas où des services web ont bien été déployés, mais avec des fichiers sensibles comme .env laissés accessibles depuis le réseau externe…
On peut aussi imaginer des cas où quelqu’un crée un service web avec OpenClaw sans vraiment savoir ce qu’il fait, laisse la clé telle quelle dans le code source HTML, se fait voler la clé et reçoit soudainement une facture salée.

 
holywork 2026-03-01

Les humains aussi choisissent mal au hasard. Il ne devrait pas y avoir de motif, mais le fait d’essayer délibérément d’éviter les motifs peut aussi être considéré comme un motif.

 
roxie 2026-02-25

Claude Opus 4.6 : 18 fois sur 50

Je suis vraiment très curieux de savoir pourquoi Claude code n’a pas généré une chaîne aléatoire.

 
mammal 2026-02-23

Ah... maintenant je comprends pourquoi les profs qui doivent réenseigner le calcul différentiel et intégral aux étudiants de première année d’école d’ingénieurs ont cette expression.

 
jayhanx 2026-02-23

Pfff, là c’est quand même abusé.