- Le rapport sur des opérations de cyberespionnage fondées sur l’IA publié par Anthropic affirme avoir détecté une attaque d’un groupe de hackers soutenu par l’État chinois, mais il est critiqué pour son absence de base technique et d’informations vérifiables
- Le rapport ne contient absolument aucun des éléments centraux d’un rapport classique de threat intelligence, comme des IoC (indicateurs de compromission), des TTP (tactiques, techniques et procédures), des informations sur les domaines, les hashs ou les outils d’attaque
- Aucun jeu de données ni aucune preuve concrète n’est présenté sur le mode opératoire détaillé de l’attaque, les outils ou types de systèmes utilisés, ou l’ampleur des dégâts, ce qui en fait une affirmation invérifiable
- En particulier, l’attribution de l’attaque à un groupe lié au gouvernement chinois est avancée sans fondement, ce qui constitue une annonce irresponsable ne tenant pas compte des retombées diplomatiques possibles
- Dans l’ensemble, le rapport est considéré comme un document utilisé pour promouvoir les produits d’IA de l’entreprise sans preuves factuelles, ce qui souligne la nécessité de renforcer la transparence et les critères de vérification dans le secteur
Vue d’ensemble du rapport d’Anthropic
- Anthropic, l’entreprise qui développe l’assistant IA Claude, a récemment publié un rapport affirmant avoir détecté une « opération de cyberespionnage pilotée par l’IA »
- Selon ce rapport, vers septembre 2025, le groupe de hackers soutenu par l’État chinois GTG-1002 aurait mené des attaques contre environ 30 organisations, avec certaines intrusions qui auraient réussi
- L’attaque aurait utilisé une instance de Claude Code pour mener de manière autonome des tests de pénétration et aurait automatisé 80 à 90 % des tâches tactiques
Absence de fondement technique
- Le rapport ne publie aucun indicateur de compromission (IoC) habituellement fourni, comme des domaines, hashs, IP, e-mails de phishing ou outils utilisés
- Sont également absents une analyse fondée sur le framework MITRE ATT&CK, la chronologie de l’attaque, des informations sur le tooling ou encore des recommandations de réponse
- Comparé, par exemple, au rapport de la CERT française sur APT28, il est jugé en dessous des standards de l’industrie dans sa forme
Des affirmations impossibles à vérifier
- Le chiffre selon lequel « l’IA a réalisé 80 à 90 % du travail tactique » dans le rapport est invérifiable
- Il est affirmé que Claude a réalisé des extractions de certificats, des collectes d’identifiants et des requêtes sur des services internes, mais sans aucune mention de la méthode d’exécution concrète ni des outils utilisés (comme Mimikatz)
- Il n’y a pas non plus d’explication sur les systèmes ou environnements compromis, ni sur la manière dont les données ont été traitées
Le problème de l’attribution
- Le rapport attribue catégoriquement l’attaque à un groupe lié au gouvernement chinois, mais sans fournir le moindre fondement
- On ne sait ni de quel groupe APT il s’agit, ni sur quelle analyse repose cette attribution
- L’auteur critique cette attribution étatique sans preuve, qu’il juge diplomatiquement risquée et irresponsable
Conclusion et critiques
- Le rapport semble avant tout orienté vers la promotion de sa propre solution de défense IA, sans véritable vérification des faits
- Dans son dernier paragraphe, il recommande que « les équipes sécurité appliquent l’IA à la défense », ce qui laisse apparaître une intention de pousser à la vente de produits de sécurité IA
- L’auteur qualifie cela de « comportement honteux et non professionnel » et appelle à renforcer les standards de vérification et la responsabilité éthique dans l’ensemble du secteur
- Des affirmations sans fondement peuvent nuire à la crédibilité de la recherche en sécurité, d’où la nécessité de publier des preuves factuelles
2 commentaires
Le rapport d’Anthropic est trop léger pour être jugé fiable
Première opération de cyberespionnage pilotée par l’IA déjouée
Avis sur Hacker News
Autrefois, quand j’étais SRE/administrateur systèmes dans un labo de recherche en IA d’une entreprise FAANG, on m’a demandé de tester des modèles de base ajustés pour la sécurité de l’information
Je les ai poussés à tenter de pirater une imprimante simulée ou une machine Linux, mais en pratique ils n’ont pas été d’une grande aide
Je ne pense pas que ce genre de modèles soit très utile pour la coordination d’attaques. Surtout quand l’API est reliée à un compte bancaire, construire une structure de commande et de contrôle au-dessus d’un système exposé publiquement est un choix risqué
Les IA récentes sont bien meilleures qu’avant, et il suffit de contourner les filtres de sécurité pour qu’elles exécutent facilement des tâches liées à la sécurité
Le modèle Sonnet a été entraîné sur des patterns de code occidentaux, ce qui l’aide à repérer les vulnérabilités dans des systèmes traitant des données de la même distribution
Il est aussi plus simple d’y reproduire un ton de langage naturel pour des attaques de phishing
L’historique des corrections du blog Anthropic est intéressant
Le 14 novembre 2025, « des milliers de requêtes par seconde » a été corrigé en « des milliers de requêtes, survenant plusieurs fois par seconde »
Un humain peut aussi exécuter plusieurs tâches par seconde via du code
Les gens sous-estiment les APT (menaces persistantes avancées)
Là où je travaillais, il y a eu une compromission de Gmail, avec une attaque composite combinant plusieurs zero-days et une campagne d’ingénierie sociale
Au final, des traces pointaient vers un acteur étatique précis, et l’IA sert à accélérer l’efficacité de ce type d’attaques
Ils jouent sur le volume, pas sur la qualité. C’est pour ça que je ne fais pas totalement confiance au rapport d’Anthropic
Il existe un gros fossé de connaissances entre les chercheurs en infosec et les chercheurs en sécurité ML
Anthropic a beaucoup des seconds, et pas assez des premiers
L’article Attacker Moves Second traite aussi de cet écart
Côté ML, on utilise l’ASR (Attack Success Rate) comme métrique, alors qu’en sécurité un seul succès est déjà grave
Le ML part de tests statiques, la sécurité suppose des attaquants adaptatifs
Le ML joue le rôle de blue team, les chercheurs en sécurité celui de red team
L’article entier m’a donné l’impression d’un texte marketing du genre « Claude est tellement puissant que des hackers chinois l’utilisent »
Lien vers l’article connexe
Du coup, on dirait que le rapport a été rédigé en dehors des standards du secteur
Ils ont peut-être réellement détecté une attaque, mais l’attribuer d’emblée à une organisation soutenue par le gouvernement chinois ressemble à du marketing exagéré
Cela dit, s’ils ne le publiaient pas, on pourrait aussi les accuser de le dissimuler, donc il peut aussi s’agir d’une communication à visée d’alerte
Le problème, c’est le manque de preuves pour affirmer que l’attaque venait d’un groupe soutenu par la Chine
Ce genre de rapport ressemble à un message politique destiné à encourager l’investissement du gouvernement américain
Ces éléments figureraient peut-être dans un rapport destiné au gouvernement, mais peuvent être omis dans un simple billet de blog
En revanche, conclure que « manque de preuves » équivaut à « manipulation politique » me paraît excessif
Le simple fait que l’IA puisse servir à ce type d’attaques constitue déjà un signal d’alerte suffisant
Il est possible qu’ils aient délibérément mis en avant un incident contenant quelques IP chinoises
Je me demande si Anthropic a vraiment des experts en sécurité en interne
C’est peut-être simplement une stratégie d’entreprise, mais il se peut aussi que leur structure manque réellement de compétences en sécurité
Lien YouTube
Quiconque a déjà utilisé une IA d’assistance au code comme Claude ne sous-estime pas ses capacités
Les affirmations du rapport me semblent donc tout à fait plausibles
Son analyse de
tcpdumpou des tables de routage m’a été assez utileIl faut cependant connaître ses limites, savoir quand il dysfonctionne et pouvoir intervenir soi-même
Cette habitude qu’ont certains de parler en experts sans jamais avoir testé l’outil inspire peu confiance
La simple plausibilité ne suffit pas à faire un rapport digne de confiance
Le rapport d’Anthropic m’a donné l’impression d’une publicité disant que notre technologie est si puissante qu’elle peut être détournée
Comme une pub pour une arme qui dirait : « regardez à quel point cette arme est dangereuse »
En voyant le titre au début, j’ai cru qu’il s’agissait d’Anthropic, la société de papier, qui fabriquait un papier à l’odeur bizarre
Et même après avoir tout lu, ça me semble toujours être du grand n’importe quoi