Une étude du MIT conclut que l’usage de l’IA reconfigure le cerveau et entraîne un déclin cognitif
(publichealthpolicyjournal.com)- Une étude du MIT montre que l’usage de LLM comme ChatGPT entraîne un affaiblissement de la connectivité cérébrale et une baisse de la mémoire, conduisant à un déclin cognitif à long terme
- Les étudiants participants ont vu leur capacité d’intégration créative et leur autonomie diminuer à mesure qu’ils dépendaient davantage de l’IA
- Des examens EEG ont confirmé une hypoactivation des réseaux d’attention et de traitement visuel dans le groupe LLM
- Le groupe utilisant les moteurs de recherche a conservé de meilleures fonctions exécutives, une activation de la mémoire et des capacités de traitement visuel
- Même après l’usage des LLM, un rétablissement complet des fonctions cérébrales s’est avéré difficile, et la dépendance à l’IA a mené à une tendance de « transfert de charge cognitive »
Principales conclusions de l’étude du MIT : usage des LLM et déclin cognitif
L’étude menée au MIT, intitulée "Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task", révèle qu’une dépendance répétée à une IA comme ChatGPT peut provoquer des atteintes cognitives durables au niveau du cerveau.
Les étudiants participants ont constaté que plus ils rédigeaient des essais en s’appuyant sur l’IA, plus ils subissaient un affaiblissement des connexions neuronales, une baisse de la mémoire et une perte du sentiment d’appropriation de la tâche.
Les contenus générés par l’IA obtenaient parfois de bonnes évaluations en apparence, mais le cerveau montrait parallèlement une tendance progressive à passer dans un état de désactivation.
Baisse de la connectivité cérébrale et phénomène de dépendance à l’intelligence artificielle
- Les mesures EEG ont montré que la connectivité cérébrale (systematic neural connectivity) diminuait progressivement à mesure que l’usage de l’IA augmentait
- Groupe utilisant uniquement le cerveau : connectivité la plus forte et la plus étendue
- Groupe moteur de recherche : niveau intermédiaire d’activation cérébrale
- Groupe LLM : affaiblissement de la cohésion dans toutes les bandes d’ondes cérébrales (alpha, bêta, delta, thêta)
- Dans le groupe LLM en particulier, les réseaux d’attention et de traitement visuel étaient nettement hypoactivés.
- Lors de la session 4, quand ils ont tenté d’écrire sans l’aide de l’IA, les utilisateurs expérimentés des LLM ont montré une baisse de fonctionnement des réseaux centraux du cerveau.
Distorsion de la mémoire et des trajectoires d’apprentissage chez les utilisateurs de LLM
- Après avoir dépendu des LLM, les étudiants ont constaté qu’ils se souvenaient mal de ce qu’ils venaient d’écrire
- Des interférences nettes ont été observées dans les voies cérébrales liées à la mémoire à long terme et à l’apprentissage
- Pendant l’usage de l’IA, l’intégration de l’information par le cerveau et l’approche auto-motivée se sont affaiblies
- Les participants ont ressenti une distance psychologique vis-à-vis du résultat et un recul du sentiment de propriété
Les limites du passage de l’IA à l’usage du cerveau seul
- Lors de la quatrième session, le groupe ayant d’abord utilisé un LLM puis écrit uniquement avec son propre cerveau a montré que l’activation cérébrale ne revenait pas au niveau de la session initiale (cerveau seul)
- Plusieurs indicateurs, dont les ondes cérébrales, l’effort fourni et la conscience de soi, ont montré une tendance à rester en dessous du niveau de référence
Les utilisateurs de moteurs de recherche conservent une implication cérébrale plus saine
- Le groupe utilisant les moteurs de recherche a maintenu un niveau élevé sur des indicateurs cognitifs majeurs comme les fonctions exécutives, l’activation de la mémoire et le rappel de citations
- Les EEG ont mis en évidence un renforcement de l’activation des lobes occipitaux et pariétaux, étroitement lié au traitement visuel et à l’effort de travail
Le transfert de charge cognitive provoqué par la dépendance à l’IA
- L’équipe de recherche a clairement observé que, lorsqu’il est exposé de façon répétée aux LLM, le cerveau tend à cesser par lui-même les efforts d’intégration de l’information et de mémorisation (neural efficiency adaptation)
- Cela mène à une attitude de travail passive, une édition minimale et une baisse du niveau d’intégration conceptuelle
Efficacité à court terme, dette cognitive à long terme
- Le groupe LLM a obtenu en apparence un certain niveau de score auprès des évaluateurs, mais a aussi montré des limites nettes :
- manque d’intégration stratégique
- réduction de la diversité des structures d’expression
- caractère bref et mécanique des productions
- Avec le temps, une tendance constante à la baisse de l’engagement cognitif, de la performance et de la satisfaction personnelle s’est maintenue
Conclusion et recommandations de l’étude
- Plus une population nombreuse s’appuie sur l’intelligence artificielle pour accomplir des tâches complexes, plus le risque d’un déclin rapide des capacités cognitives fondamentales et créatives de l’être humain augmente.
- L’étude souligne l’importance, lors de l’usage de l’IA, de faire des pauses régulières et de consacrer du temps à utiliser directement son propre cerveau
- L’intelligence artificielle ne se contente pas de remplacer le travail humain : elle affecte le système de pensée humain et les fonctions mêmes du cerveau
Présentation de l’auteur
- Nicolas Hulscher, MPH
- Épidémiologiste et Foundation Administrator de la McCullough Foundation
- D’autres contenus liés sont disponibles via les comptes de la McCullough Foundation et de l’auteur sur X (anciennement Twitter)
2 commentaires
À lire le contenu, on a l’impression que le groupe qui a utilisé un LLM s’est contenté de prendre la réponse sous la dictée.
D’ordinaire, on l’utilise plutôt avec un objectif ou un déroulé souhaité, en vérifiant la réponse puis en répétant les retours, non ? Je me demande si le résultat serait le même dans ce cas.
Avis Hacker News
J’aimerais partager une expérience d’échange avec un doctorant que j’admirais à l’époque de mon master. Chaque fois qu’il lisait un article, il écrivait lui-même le code pour l’implémenter. Là où il me fallait des mois, lui terminait souvent le code en quelques jours. Il m’expliquait qu’on progresse avec beaucoup de pratique. Non seulement il codait vite, mais il est aussi devenu de plus en plus rapide pour analyser les articles et intégrer les idées, tout en développant une excellente intuition de ce qui fonctionne. Aujourd’hui, je suis moi aussi assez senior et je code rarement directement, mais je trouve toujours extrêmement utile de manipuler moi-même de nouveaux morceaux de code et de nouvelles idées, même en galérant. Je pense que ceux qui croient qu’il suffit juste de modifier un peu le prompt passent à côté d’une occasion d’apprentissage vraiment essentielle
Je pense qu’en pratique, un écart de compétences est déjà en train de se créer sous nos yeux. Il y a d’un côté (1) ceux qui comprennent les concepts en profondeur, construisent un modèle mental, puis peuvent implémenter eux-mêmes du code à n’importe quel niveau, et de l’autre (2) ceux qui externalisent ce processus à la machine et perdent lentement cette capacité. Aujourd’hui, la différence n’est pas encore flagrante, mais je crois que dans quelques années elle sera évidente
Il faut se méfier du sophisme « les vrais programmeurs écrivent en assembleur ». Quand les compilateurs se sont généralisés, on craignait déjà que les programmeurs ne comprennent plus le fonctionnement de leur code. C’était vrai dans une certaine mesure, mais la plupart des gens arrivaient quand même à construire des choses concrètes sans trop de problème. Si on arrête de réfléchir, bien sûr qu’on apprend moins. Mais si on peut raisonner à un niveau d’abstraction supérieur, les détails ne sont pas toujours essentiels. La limite de l’université, c’est que ce n’est pas le « niveau d’abstraction suivant », mais une succession d’idées soigneusement sélectionnées uniquement pour transmettre un savoir validé. Ce n’est pas la même chose que de dégager du temps, dans une startup, pour construire quelque chose soi-même ou s’attaquer à des problèmes plus vastes. Bien sûr, cette approche ne convient pas à tous les doctorats. Dans certains domaines, il faut connaître les détails, mais dans le contexte actuel de spécialisation accrue, je pense que cela peut même être globalement bénéfique
J’ai l’impression que c’est similaire à l’étude des mathématiques. On peut lire des livres de maths toute la journée et admirer les idées, mais si on ne résout pas soi-même les exemples de définitions, de théorèmes et d’exercices, on n’apprend pratiquement rien
Dans la data science, on dit qu’il n’y a pas de repas gratuit. À mesure que des outils comme ChatGPT se généralisent, même les doctorants ou plus semblent presque magiques quand ils continuent à étudier par eux-mêmes sans utiliser du tout ces outils. Je vois déjà des gens dont le niveau est insuffisant, incapables de coder au-delà d’un niveau intermédiaire ou avec une intuition affaiblie. Ce n’est plus du syndrome de l’imposteur, c’est le fait de ne plus pouvoir vraiment travailler correctement sans IA. Pour chaque sujet, j’essaie d’abord de réfléchir seul et de formuler mes propres questions sans outil. Puis, une fois que j’ai un certain ressenti du problème, je vais poser mes questions à ChatGPT
Intéressant. Je me demande s’il écrivait vraiment le code à la main, sur papier et stylo. J’ai l’impression que cette méthode aide vraiment à comprendre (je précise que je ne code pas professionnellement). Chez les historiens, c’est un peu pareil : ceux qui passent leurs journées dans des archives physiques finissent par développer avec le temps une intuition et une finesse de compréhension du sujet. À l’inverse, quand on se contente de récupérer sur Google les citations et documents dont on a besoin, on risque davantage de n’avoir qu’une vision superficielle du sujet. On réfléchit moins sous plusieurs angles, on voit moins les liens entre les phénomènes, et on a aussi tendance à s’accrocher excessivement à sa propre thèse
Il y a quelques points à préciser. (1) Cet article est sur arXiv, donc ni publié ni relu par les pairs pour l’instant. Il faut le lire en gardant cela à l’esprit. (2) 18 personnes par cohorte. (3) 54 au total. Le N est faible, et comme il semble surtout s’agir d’étudiants du MIT âgés de 18 à 22 ans, il y a des questions de reproductibilité et de généralisation. Pendant l’expérience, l’activité cérébrale était mesurée par EEG, ce qui crée un environnement inhabituel et inconfortable. De plus, le sujet de l’étude est l’écriture d’un essai avec un LLM, avec un moteur de recherche ou sans outil, donc les participants savent parfaitement ce qu’ils utilisent. Le résumé de l’article dit qu’il étudie le coût cognitif de l’usage d’un LLM lors de tâches de rédaction. La rédaction d’un essai est une activité complexe qui mobilise de nombreux processus cognitifs et qui est couramment utilisée à l’école ou dans les examens. Elle exige de gérer simultanément des aspects macro comme l’organisation des idées et la structuration de l’argumentation, et des aspects micro comme le choix des mots, la grammaire et la syntaxe. L’EEG a été utilisé pour évaluer l’engagement cognitif, la charge cognitive et l’activation cérébrale. L’étude compare aussi l’activité cérébrale avec recherche internet classique et sans outil. Article original
Les 54 participants avaient entre 18 et 39 ans (moyenne 22,9 ans, SD=1.69) et ont été recrutés dans cinq universités : MIT, Wellesley, Harvard, Tufts et Northeastern. Il y avait 35 étudiants de premier cycle, 14 étudiants de cycle supérieur, et 6 postdocs/chercheurs/ingénieurs logiciels. La taille et la composition de l’échantillon sont des limites, et des études de suivi devraient être menées avec des échantillons plus larges et plus divers. Cela dit, je ne pense pas qu’on puisse aller jusqu’à parler de « difficulté de reproduction » pour cette seule raison
Je pense qu’il faut arrêter avec l’argument du « c’est avant peer review donc il faut prendre ça avec des pincettes ». Le peer review n’est pas non plus un processus scientifique idéal ; il entraîne souvent des délais inutiles, des commentaires sans intérêt et revient surtout à offrir du travail gratuit aux grands groupes de publication. J’ai publié plus de 30 articles et j’ai eu autant de bonnes évaluations que de mauvaises. À minima, il faudrait aller vers l’open peer review et davantage d’échanges avec les éditeurs. La science devrait être un marché d’idées. Cela dit, le reste des critiques me semble tout à fait valable. Les conclusions de l’article sont aussi trop hâtives et proches de la communication. Personnellement, je pense que le système actuel de peer review est dépassé
Cette étude est une expérience sur l’impact de ChatGPT sur la capacité des utilisateurs à rédiger des essais. Elle montre surtout que si l’on ne s’exerce pas à écrire, les compétences d’écriture se dégradent, et que l’activité cérébrale diffère selon les méthodes ; ce n’est pas en soi une preuve d’un effet particulièrement nocif. D’ailleurs, l’article utilise le terme « cognitive debt » plutôt que « cognitive decline », ce qui a des implications importantes pour l’interprétation. Je pense que des résultats similaires pourraient apparaître dans d’autres études, mais il est trop tôt pour conclure que l’IA/les LLM sont mauvais pour le cerveau. On pourrait aussi lire cela comme une réduction de la charge cognitive qui rend la rédaction plus facile. En revanche, d’autres études sont nécessaires, notamment sur l’évaluation de la qualité des résultats
Il faut aussi noter qu’ici, « IA » est utilisé comme synonyme de LLM. Or l’IA recouvre des choses très diverses. Il est difficile d’imaginer que la génération d’images, de vidéos ou d’audio conduise à un déclin cognitif. Pour les LLM, je dirais plutôt qu’ils peuvent encourager une forme de paresse intellectuelle en supprimant le besoin de mémoriser soi-même certaines choses
Je pense que cet effet se reproduit très facilement. Récemment, quand j’interagis avec des gens qui ont commencé à beaucoup utiliser les LLM, j’ai vraiment l’impression qu’ils ont perdu plusieurs points de QI. Je vois des gens autrefois très engagés dans les discussions qui, désormais, n’arrivent plus à parler sans vérifier d’abord la réponse de Grok ou de ChatGPT
L’article et son titre répètent en pire une version antérieure, plus originale. Les chercheurs eux-mêmes ont clairement écrit dans leur FAQ que les médias interprétaient mal leur travail et qu’ils ne voulaient pas voir des formulations comme « les LLM nous rendent stupides ». Certains commentaires HN sont un bon exemple de biais cognitifs : accepter une information sans vérifier le contenu réel
Je comprends pourquoi on parle de sujet « redditifié ». Ce genre de thème clickbait revient sans cesse. En particulier, cette étude ne porte que sur 18 personnes ayant utilisé ChatGPT quatre fois sur quatre mois, sans vrai contrôle du bruit. Je suis d’accord pour dire que l’abus d’IA est un problème, mais ce type d’étude n’est qu’un clickbait sur un sujet que nous n’aimons pas
J’ai l’impression que presque personne ne lit vraiment l’article. Dans les sessions 1 à 3, le groupe qui utilisait le LLM montrait une connectivité réduite à la session 4 lorsqu’il devait travailler sans LLM, tandis que tous les groupes voyaient leur connectivité augmenter au fil des sessions. Le point important, c’est qu’à la session 4, cette connectivité n’était pas revenue complètement au niveau initial (session 1), mais se situait quelque part entre les deux. Autrement dit, il y avait quand même apprentissage. Le concept philosophique d’Extended Mind est central ici. Mieux encore, quand le groupe ayant passé les sessions 1 à 3 sans LLM se met à utiliser un LLM à la session 4, le cerveau s’active de façon explosive. C’est là, en réalité, le point essentiel des conclusions de l’étude
Personnellement, après huit mois de codage avec ChatGPT, j’ai senti mon cerveau ralentir peu à peu. Les résultats de l’étude me parlent donc beaucoup. Cela dit, je m’attends à ce qu’on voie très peu de nouvelles études présentant les choses sous un angle négatif. Les forces qui pilotent la société ne veulent pas d’une opinion publique défavorable à l’IA, donc c’est inévitable
Je pense qu’il ne faut pas laisser les LLM écrire ou réviser à notre place. On peut les utiliser pour obtenir du feedback, explorer des idées ou repérer des angles morts, mais la rédaction elle-même doit être menée jusqu’au bout par soi-même. Il est trop facile de déléguer son cerveau au LLM. Et ce n’est pas vrai seulement pour les essais : en programmation aussi, à force de s’appuyer sur un LLM pour résoudre les problèmes, j’ai senti un véritable déclin cognitif. Dans un écosystème de programmation inconnu, si l’on se contente de copier-coller des erreurs encore et encore, on résout certes le problème rapidement, mais on apprend moins réellement. Bien sûr, cela rend le démarrage plus facile et évite de rester bloqué, donc il faut un équilibre. Il faut absolument garder la capacité de lutter directement avec le problème
Mon expérience est inverse. Plutôt que de simplement copier-coller des erreurs ou d’accepter immédiatement les réponses de l’IA, je continue à demander : « pourquoi est-ce que ça marche ? ». Je lui fais expliquer ligne par ligne chaque commande ou flag, et je ne passe à l’étape suivante que lorsque j’ai tout compris. Du coup, même si je ne retiens pas aussi profondément que par une exploration entièrement autonome, je peux rencontrer davantage de problèmes plus vite et augmenter mon volume d’apprentissage
Quand Firefox a ajouté la correction automatique, j’ai pris l’habitude de revenir sur les bonnes réponses et de m’exercer à écrire sans fautes, et j’ai beaucoup progressé (l’anglais n’est pas ma langue maternelle). Pour moi, les LLM sont pareil : des outils pour apprendre plus vite et arriver plus vite à une conclusion. Quand j’oublie sur un nouveau projet une configuration que j’avais déjà faite auparavant, le LLM peut me rappeler ce que j’aurais noté dans un ancien wiki. L’important est de s’autoévaluer pour devenir un meilleur ingénieur grâce au LLM
C’est bien là le vrai sujet, mais si on utilise les LLM avec modération, ils permettent de rattraper rapidement son propre niveau et les domaines adjacents, de ne pas se bloquer sur de petites lacunes de connaissance et de se concentrer sur le travail essentiel. Par exemple, j’ai pu implémenter rapidement en C du traitement de signal acoustique sous-marin, dans un domaine que je n’avais pas besoin de maîtriser parfaitement. Avant, j’aurais probablement passé mon temps à lire le code des autres
Faire écrire un texte à un LLM, c’est de la paresse, et le résultat n’est pas satisfaisant. En revanche, écrire soi-même un brouillon puis utiliser le LLM pour obtenir un retour, vérifier les angles morts ou trouver un meilleur vocabulaire, c’est une bonne approche
Je vois cette habitude des LLM comme une dépendance excessive au GPS ou aux applis de cartographie. C’est vraiment pratique, mais cela atrophie aussi certaines zones du cerveau utiles à la mémoire spatiale ou à la prise de décision. Il m’est déjà arrivé de faire aveuglément confiance au système et d’échouer lourdement. Autrefois, les cartes papier étaient moins pratiques, mais en contrepartie elles offraient plus d’interaction et plus de temps de réflexion. Aujourd’hui, hors zones de conflit, on n’utilise presque plus de cartes papier
Même s’il s’agit d’une étude très commentée, comme ce papier-ci, la méthodologie comporte de sérieuses limites. On n’a que 54 personnes réparties en 3 groupes, soit 9 par condition, ce qui est très loin de suffire pour avancer des affirmations comme une « reprogrammation du cerveau ». Tout ce que l’étude montre, c’est qu’il existe un schéma cérébral différent lors d’une rédaction assistée par IA ; cela ne prouve pas un dommage permanent. Quand on utilise un outil, il est normal que l’activité cérébrale soit moindre, tout comme le calcul mental diminue quand on utilise une calculatrice. Des termes comme « atteinte cognitive » ou « dégâts graves » ne correspondent pas non plus à ce que dit réellement l’étude. En outre, des mesures EEG de surface ne permettent pas d’inférer des changements profonds du cerveau. Les auteurs reconnaissent eux-mêmes ces limites. Même le chiffre « 83,3 % n’ont pas pu se souvenir d’une seule phrase de leur essai » ne représente en réalité que 15 personnes sur 18
Comme exemples d’usage quotidien de l’IA, quelqu’un évoque l’apprentissage très pratique du brasage, de l’utilisation d’un multimètre, du montage de circuits, des systèmes solaires/batteries, de la mise en place de réseaux LoRa, etc. Dans tous les cas, il n’apprend pas uniquement la théorie : il expérimente directement par lui-même. Quand un problème survient, il utilise l’IA pour en identifier la cause, puis répète les questions et les essais jusqu’à comprendre solidement le principe. Les vidéos YouTube ne lui conviennent pas, et une IA textuelle lui correspond davantage. Il préfère apprendre en faisant exprès des erreurs et en cassant des choses. Il applique avec succès à l’électronique bon marché la stratégie d’essais-erreurs qui avait bien marché pour lui en logiciel
En tant que personne qui fait ce genre de choses en pratique, je me demande pourquoi choisir l’IA. Apprendre par le texte me semble être l’un des moyens les plus difficiles. Une bonne vidéo montre bien mieux le processus réel ainsi que les critères de réussite et d’échec. Cela dit, il devient effectivement de plus en plus difficile de trouver de bonnes vidéos
Moi aussi, avant l’arrivée des LLM, j’ai appris de façon comparable en construisant des synthétiseurs analogiques. Là où je suis d’accord, c’est que je consultais les mêmes textes disponibles sur le web que ceux sur lesquels les LLM s’appuient. Quand quelque chose ne marchait pas, je me tournais vers le matériel réel ou la documentation. Il existait déjà une voie d’apprentissage tout à fait suffisante sans LLM, et je ne suis pas encore convaincu que les LLM constituent forcément une méthode d’apprentissage supérieure aux autres
Il faut effectuer un vrai travail physique pour que la vitesse d’apprentissage reste alignée sur celle du cerveau ; des boucles de feedback trop rapides, comme dans le « vibe coding » en logiciel, ne sont en réalité pas très utiles à l’apprentissage. Elles poussent le cerveau à éviter le processus même d’apprentissage
Si l’on utilise le LLM comme un disciple interrogeant son maître, je ne vois aucun problème
De façon comparable, je travaille sur un manuel sans corrigé et, chaque fois que je bloque, je demande un retour à ChatGPT ou des indices, ce qui m’aide énormément
On a presque l’impression que l’article a été écrit par une IA, tant il est difficile d’arriver à cette conclusion en lisant réellement le papier. L’expérience consistait à écrire uniquement des essais au format SAT, pendant moins de 30 minutes, sur 4 mois, et seule une partie des participants utilisait l’IA. En conclure qu’utiliser l’IA 20 minutes d’un coup, une fois par mois, rend le cerveau visiblement plus bête n’a aucun sens. Ce que l’étude montre réellement, c’est qu’on a moins d’attachement et moins de souvenirs pour un résultat qu’on n’a pas produit soi-même. Et cela vaut aussi pour un travail fait par quelqu’un d’autre
Je pense que la manière dont on utilise l’IA est très étroitement liée à son impact sur l’apprentissage. Pour ma part, j’ai plutôt l’impression qu’elle me pousse à réfléchir bien plus profondément qu’avant, en la questionnant sans cesse et en discutant la logique. Par exemple, lorsque je découvre une fonctionnalité mal documentée, j’utilise l’IA pour comprendre le flux du code, puis je débat avec elle de différentes options : amélioration du naming, refonte de la structure, documentation, etc. Comme les LLM sont simplement bien plus rapides pour la recherche d’information, ils m’épargnent un peu d’effort, mais me poussent en réalité à réfléchir davantage en profondeur. Bien sûr, j’ai contourné certains domaines comme
mermaid, mais grâce au LLM j’ai pu accomplir un vrai travail ; sinon, je pense que je serais resté cantonné à des tâches sans intérêtL’étude et les articles qui en ont parlé ont été interprétés de façon tellement sensationnaliste que l’équipe de recherche a dû publier une FAQ séparée. L’auteur de l’article demande à plusieurs reprises de ne pas utiliser des formulations du type « les LLM rendent stupide »
Discuter de « déclin cognitif à long terme » à partir de seules mesures techniques de réseaux neuronaux relève de l’exagération. Par exemple, le résultat selon lequel « 83 % des utilisateurs de LLM ne pouvaient pas réciter une seule phrase de l’essai qu’ils venaient d’écrire » revient simplement à constater qu’on ne retient pas un texte qui n’est pas vraiment passé par ses propres mains. Comme l’IA l’a écrit à sa place, cela paraît tout à fait normal