La dette cognitive qui s’accumule lorsqu’on écrit un essai avec un assistant IA

(arxiv.org)

1 points par GN⁺ 2025-06-17 | 1 commentaires | Partager sur WhatsApp

Prépublication mesurant le coût cognitif de l’usage des LLM dans l’apprentissage de la rédaction, afin de tester si des outils d’IA largement utilisés dans les études et le travail peuvent affaiblir les capacités d’apprentissage
Les participants ont été répartis en groupes LLM, Search Engine et Brain-only, ont rédigé trois essais, puis lors d’une 4e session une partie du groupe LLM a écrit sans outil tandis qu’une partie du groupe Brain-only a utilisé un LLM
54 personnes ont participé aux sessions 1 à 3, puis 18 d’entre elles à la 4e session ; l’étude a combiné EEG, analyses NLP, entretiens après chaque session, et notation par des enseignants humains ainsi que par un AI judge conçu séparément
Plus le soutien externe était important, plus la connectivité cérébrale diminuait : le groupe Brain-only présentait le réseau le plus fort, le groupe Search Engine un niveau intermédiaire, et l’assistance LLM la cohésion globale la plus faible
Sur quatre sessions étalées sur quatre mois, le groupe LLM a obtenu des résultats inférieurs au groupe Brain-only sur les plans neuronal, linguistique et de notation, avec un sentiment d’appropriation et une capacité de citation immédiate également plus faibles

Le coût cognitif des LLM mesuré dans la rédaction d’essais

L’étude se concentre sur le coût cognitif laissé par l’usage des LLM lorsqu’on rédige des essais dans un cadre éducatif
Les LLM permettent des expériences d’apprentissage personnalisées, un feedback immédiat et un meilleur accès aux ressources éducatives, mais à mesure que leur usage se généralise, l’implication dans la pensée critique et l’analyse approfondie peut diminuer
La rédaction d’essais est une tâche fréquente pour évaluer les capacités des élèves à l’école et dans les tests standardisés, et a été retenue car elle mobilise simultanément plusieurs processus cognitifs dans un travail complexe
L’article est à l’état de preprint, under review

Participants et conception des sessions

Les participants ont été répartis en trois groupes
- Groupe LLM : rédaction d’essais avec l’outil LLM désigné
- Groupe Search Engine : rédaction d’essais à l’aide d’un moteur de recherche
- Groupe Brain-only : rédaction d’essais sans outil externe
Lors des sessions 1 à 3, chaque participant conservait la même condition assignée
Lors de la 4e session, la condition de certains participants a été modifiée
- LLM-to-Brain : des participants utilisant auparavant un LLM ont écrit sans outil
- Brain-to-LLM : des participants qui écrivaient auparavant sans outil ont utilisé un LLM
Au total, 54 personnes ont participé aux sessions 1 à 3, et 18 d’entre elles ont terminé la 4e session
À chaque session, les participants rédigeaient un essai à partir d’un sujet de type SAT ; pour les sessions 1 à 3, 3 sujets étaient proposés par session, soit 9 sujets au total

Méthodes de mesure

L’activité cérébrale a été mesurée par EEG
- L’activité du cerveau des participants a été enregistrée afin d’évaluer l’engagement cognitif et la charge cognitive
- L’objectif était aussi de mieux comprendre l’activation neuronale pendant la rédaction
Le texte des essais a fait l’objet d’analyses NLP
- Named Entities Recognition (NER)
- n-gram
- ontologie thématique
- similarité et distance fondées sur les embeddings
Après chaque session, des entretiens ont été menés avec les participants
- respect de la structure de l’essai
- capacité à citer l’essai
- exactitude des citations
- sentiment d’appropriation de l’essai
- satisfaction, etc.
La notation a combiné des enseignants humains et un AI judge conçu séparément

Résultats EEG : plus le soutien externe est important, plus la connectivité cérébrale baisse

Les trois groupes ont montré des schémas de connectivité neuronale différents, reflétant des stratégies cognitives distinctes
La connectivité cérébrale diminuait de façon systématique avec la quantité de soutien externe
- Groupe Brain-only : réseau le plus fort et le plus étendu
- Groupe Search Engine : niveau d’engagement intermédiaire
- Assistance LLM : cohésion globale la plus faible
À la 4e session, les participants LLM-to-Brain ont montré une connectivité neuronale plus faible et une participation réduite des réseaux alpha et bêta
À l’inverse, les participants Brain-to-LLM ont montré un rappel mnésique plus élevé et une réactivation plus large des nœuds occipito-pariétaux et préfrontaux
- Ce schéma pourrait être lié au traitement visuel et ressemble à ce qui a souvent été observé dans le groupe Search Engine

Caractéristiques des essais révélées par l’analyse linguistique

À l’intérieur de chaque groupe, une homogénéité cohérente a été observée sur les NER, n-gram et l’ontologie thématique
Les essais du groupe LLM montraient des caractéristiques linguistiques plus homogènes au sein du groupe
Le groupe Search Engine présentait, sur certains sujets, des usages de n-gram semblant refléter l’influence de l’optimisation pour la recherche
- Exemple : sur le sujet PHILANTHROPY, focalisation sur le n-gram homeless
La distance entre les essais du groupe Brain-only était toujours significativement plus grande que dans les groupes LLM ou Search Engine
Sur certains sujets, la différence entre le groupe LLM et le groupe Brain-only atteignait un niveau presque orthogonal
- Exemple : HAPPINESS, PHILANTHROPY

Sentiment d’appropriation, mémoire et capacité de citation

Le groupe LLM a montré dans les entretiens un sentiment d’appropriation plus faible vis-à-vis de ses propres essais
Le groupe Search Engine montrait aussi un fort sentiment d’appropriation, mais inférieur à celui du groupe Brain-only
La capacité à citer le contenu de son propre essai rédigé quelques minutes auparavant était également plus faible dans le groupe LLM
Le groupe Brain-only montrait à la fois un fort sentiment d’appropriation et une forte capacité de citation
Lors de la 4e session, les participants Brain-to-LLM ont utilisé un LLM mais ont montré une meilleure intégration du contenu, combinée à l’effet de leurs sessions antérieures en Brain-only, tandis que le sentiment d’appropriation était partagé

Différences observées dans l’expérience de bascule à la 4e session

Les participants Brain-to-LLM ont montré une connectivité neuronale plus élevée lorsqu’ils réécrivaient avec un outil d’IA après avoir auparavant écrit sans IA
- la directed connectivity des bandes alpha, bêta, thêta et delta augmentait à l’échelle du réseau
- les interactions entre réseaux cérébraux étaient plus étendues que lors des sessions 1 à 3 en mode LLM-only
Les participants LLM-to-Brain ont montré, lorsqu’ils écrivaient sans outil après une expérience antérieure avec un LLM, un effort neuronal moins coordonné dans la plupart des bandes
- un biais de vocabulaire propre aux LLM apparaissait également
- l’AI judge comme les enseignants humains leur ont donné de bonnes notes, mais la distance d’usage des NER et n-gram ressortait moins que dans les autres groupes et sessions
Lorsque le groupe Brain-only a utilisé un LLM à la 4e session, la connectivité cérébrale de cette session n’est pas revenue au schéma de niveau débutant observé en session 1 de Brain-only, sans toutefois atteindre le niveau de la session 3 de Brain-only
- elle montrait un état intermédiaire de participation du réseau

Conclusion et limites

L’usage des LLM a eu un impact mesurable sur les participants ; si les avantages initiaux semblaient nets, au fil des sessions sur quatre mois le groupe LLM a affiché des performances inférieures au groupe Brain-only à plusieurs niveaux
Ces performances plus faibles ont été observées conjointement dans la connectivité neuronale, les caractéristiques linguistiques et les résultats de notation
À un moment où l’impact éducatif des LLM auprès du grand public commence seulement à s’installer, le risque d’une dégradation des capacités d’apprentissage reste un enjeu majeur
Cet article vise à servir de guide préliminaire pour comprendre les effets cognitifs et pratiques de l’IA dans les environnements d’apprentissage

1 commentaires

GN⁺ 2025-06-17

Avis de Hacker News

Plutôt que d’appeler cela « accumulation de dette cognitive », je parlerais simplement de déclin cognitif ou de perte de capacités cognitives.
Il est normal d’oublier une langue si on ne l’utilise pas, et le cerveau ne retient pas les informations dont il n’a pas besoin. Des études sur l’usage de la navigation Google Maps ont aussi montré que « l’usage habituel du GPS a un effet négatif sur la mémoire spatiale lors de la navigation autonome », ou encore observé une diminution de la matière grise chez les utilisateurs de cartes.
Quiconque a développé une expertise dans un domaine scientifique sait que, pour comprendre quelque chose, il faut le ruminer et explorer comment chaque idée se relie aux autres. On ne peut pas apprendre les mathématiques en parcourant simplement un manuel : il faut s’arrêter et réfléchir. À mon avis, les objets mentaux que l’on pourra ensuite utiliser pour penser sont précisément créés par l’acte de penser.
- Dans « on ne peut pas apprendre les mathématiques en parcourant simplement un manuel : il faut s’arrêter et réfléchir », le plus important, c’est l’écriture.
  Il faut beaucoup écrire. L’écriture oblige le cerveau à structurer la pensée, permet un dialogue structuré avec soi-même et fait explorer plusieurs chemins. La pensée et la réflexion seules atteignent vite leurs limites, tandis que l’écriture permet d’explorer la pensée presque indéfiniment.
  Étant donné que la pensée est si étroitement liée à l’écriture, et que l’écriture peut prendre la forme de prose, de dessins, d’équations, de graphiques, de diagrammes, etc., il est intéressant de se demander quel effet aura sur les capacités cognitives le fait que les LLM prennent en charge de plus en plus d’écriture.
- Moi, j’appellerais ça une dette cognitive. Avez-vous déjà rédigé un gros rapport avec un LLM ?
  Il est très tentant de laisser un LLM écrire beaucoup de texte, structurer le document, produire l’argumentation et les visuels. À force de lui en confier un peu plus, on finit avec un résultat qui n’est plus du tout le sien.
  Pourtant, mon nom figure sur ce rapport, et on me demande de l’expliquer et de le comprendre. Normalement, un rapport devrait être la « projection en 2D » d’une « réalité de haute dimension » présente dans l’esprit, mais un rapport pondu en un dixième du temps ne l’est pas. Sur le papier, il peut sembler convaincant, mais dès qu’il faut expliquer les concepts, on bloque.
  Au final, on se rend compte qu’il faut faire le travail soi-même, construire un modèle mental, l’exprimer, le reformuler, puis le reformuler encore. Et il faut le faire différemment selon le public visé.
  Je trouve que dette cognitive décrit bien l’écart entre le modèle mental qu’il aurait fallu construire pour rédiger un rapport avant les LLM, et celui qu’on peut presque éviter de construire en utilisant un LLM.
  Au bout du compte, mon nom figure sur le rapport ou l’article. Que peut-on attendre de moi en tant qu’auteur ? Avec le temps, ces attentes pourraient baisser. Si des questions profondes surgissent, on pourrait finir par contourner l’auteur et s’appuyer sur le modèle « mental » du LLM. Mais d’autres modèles comme les LLM peuvent avoir des « modèles », c’est-à-dire des algorithmes prédictifs, différents de la vérité fondamentale et de la réalité. Lequel permet les prédictions les plus exactes ? Cela exige une certaine profondeur de compréhension, et cette profondeur n’apparaît pas si l’on s’appuie trop sur les LLM pour écrire.
  À long terme, cela pourrait effectivement conduire à un « déclin cognitif, ou à une perte de capacités cognitives » au niveau de la population, mais je serais prudent avant de l’affirmer. L’imprimerie n’a pas produit un tel résultat, malgré les craintes des élites religieuses de l’époque que les gens ordinaires ne puissent pas interpréter correctement les textes.
  Comme cela a été dit dans ce fil, je pense que « l’écriture, c’est la pensée ». Cela dit, il existe peut-être quelque chose de meilleur que l’écriture que nous n’avons pas encore inventé. Penser, c’est développer des modèles mentaux détaillés qui permettent de prédire l’avenir avec une probabilité supérieure au hasard. Notre survie en dépend, et du point de vue de la théorie de l’information, c’est précisément ce qu’est l’évolution [0]. « Rien en biologie n’a de sens sans la lumière de l’information. »
  [0] https://www.youtube.com/watch?v=4PCHelnFKGc
- Si « le cerveau ne retient pas les informations dont il n’a pas besoin », pourquoi est-ce que je sais encore configurer config.sys et autoexec.bat pour optimiser la mémoire conventionnelle de DOS ?
  Je ne l’ai pas fait depuis 20 ans, et je suis assez sûr de ne plus jamais avoir à le refaire.
- Des expressions comme « déclin cognitif » ou « pourriture du cerveau » auraient pu sembler trop sensationnalistes, et, pour être juste, les auteurs ont bien mentionné la limite de la petite taille de l’échantillon.
  Le fait que l’article ne fournisse pas de références ou de citations pour le terme « dette cognitive » rend aussi le titre un peu étrange. Il a peut-être été changé à la dernière minute.
  C’est une étude intéressante venue du MIT. Comme pour toute étude en psychologie, il faut garder un scepticisme sain et demander une validation indépendante. Il y a aussi un côté fourre-tout avec imagerie et évaluations psychométriques incluses, mais qui n’aime pas un schéma du type « voici à quoi ressemble votre cerveau quand vous utilisez un LLM » ?
- Dire que « le cerveau ne retient pas les informations dont il n’a pas besoin » semble plausible, mais comment expliquer des compétences comme faire du vélo, dont on dit souvent qu’elles ne disparaissent pas une fois apprises ?
Les LLM donnent de plus en plus l’impression d’être une technologie de plus contre laquelle la société finira par développer sa propre immunité
Dans l’éducation, cela commence déjà par des enseignants qui parlent avec les élèves, observent leur manière d’apprendre et vérifient le processus par lequel ils démontrent leurs compétences. Dans le business aussi, on finira bientôt par comprendre que la majeure partie des communications qui ont de la valeur doit être produite directement par les personnes, en tant qu’auteurs de ce qu’elles veulent dire. L’acte d’auteur représente environ les deux tiers du cœur de la plupart des communications
Bien sûr, avant cela, pour être vraiment immunisés contre les effets secondaires, nous devrons subir un choc spectaculaire d’appauvrissement de la pensée. Le rejet des LLM par les experts face aux enthousiastes naïfs qui vouent un culte au « moyen » ressemble à une première expérience immunitaire : https://fly.io/blog/youre-all-nuts/
Chaque fois que j’utilise un LLM « à l’échelle macro » dans mes projets, ma pensée s’en trouve fortement dégradée, mes décisions me sont confisquées, et je suis moins bien préparé aux adaptations nécessaires par la suite. Pour les choses importantes, un LLM n’est strictement qu’un outil microscopique de remplissage de blancs
Ce n’est pas comme une calculatrice. Il ne s’agit pas de me retirer les algorithmes que j’aimais utiliser pour calculer à la main. C’est un système qui remplace la pensée elle-même par de la non-pensée, et qui, dans tous les domaines où on l’emploie, nuit gravement à la préparation, à la profondeur, à l’adaptabilité et au sentiment d’appropriation
- Je crois que l’une des capacités les plus sous-estimées dans le business est celle de tisser un récit cohérent
  J’assiste à beaucoup de réunions avec des ingénieurs extrêmement brillants, mais ils sont souvent incapables de présenter leur raisonnement d’une manière que puissent suivre à la fois des techniciens et des non-techniciens. Il y a un art dans l’écriture et la parole, et ce n’est qu’à la fin de la quarantaine que je commence vraiment à en mesurer la valeur. Le langage est un outil puissant, et le choix d’un seul mot peut parfois sauver ou ruiner une argumentation
  Je ne vois pas ce que les LLM pourraient faire dans cette situation, sinon l’aggraver nettement dans l’ensemble
- Tout cela est déjà en train d’arriver. Je discute des dernières idées avec un ingénieur junior sur une plateforme de chat, et ses réponses en temps réel commencent à faire une page entière, structurée en listes à puces
  Ce qui fait peur, ce n’est pas seulement qu’ils utilisent ChatGPT pour éviter de penser, c’est qu’ils pensent que personne ne s’en apercevra, ou qu’ils croient que les adultes communiquent normalement ainsi
- L’optimisme de « une technologie de plus contre laquelle la société développera une immunité » me plaît. Nous n’avons pas encore développé d’immunité collective aux technologies des réseaux sociaux des années 2010, mais j’accepte cet optimisme
- Si la majeure partie des communications de valeur doit venir des humains, on peut aussi se demander quelle part de la communication est réellement de valeur
  En réalité, je pense qu’il existe beaucoup de communications qui n’ont pas beaucoup de valeur. Mais si elles continuent à être produites et que personne ne les lit, pourquoi ne pas en automatiser la génération ?
  Bien sûr, il y a aussi un nombre considérable de choses importantes qu’il faut réussir correctement
- La question clé est de savoir quelle proportion des communications est « de valeur »
  Je suis dans le monde académique, qui devrait en théorie être l’un des métiers exigeant le plus de réflexion. Et pourtant, plus de la moitié de ce que j’écris relève de rapports en tout genre, de demandes de financement, de dossiers d’éthique et de gestion des données, de lettres de recommandation, de formulaires administratifs, etc. Il est difficile de dire que ces textes sont « de valeur » au sens où ils n’exigent pas de réflexion utile, et tant que les exigences stupides sont satisfaites, personne ne se soucie de savoir si le texte me ressemble
  Pour ces usages, les LLM sont une bénédiction : ils me permettent de consacrer plus de temps à la vraie recherche et à l’enseignement en présentiel, et pourraient donc au contraire m’aider à réfléchir davantage
La discussion sur la dette cognitive ici est juste, mais je pense qu’elle est peut-être même trop conservatrice
Il ne s’agit pas simplement d’oublier des compétences comme les langues, ou de perdre sa mémoire spatiale à force d’utiliser le GPS. Le problème pourrait être une atrophie systématique et irréversible des voies neuronales chargées du raisonnement intégré
Le risque central n’est pas tant la « dette », avec sa nuance selon laquelle on pourrait la rembourser par la pratique, que le franchissement d’un point de bascule cognitif. Un seuil où les fonctions exécutives, la synthèse et l’argumentation ont été tellement transférées à des systèmes externes comme les LLM que le cerveau biologique, par une efficacité impitoyable, ne se contente pas d’élaguer les connexions inutilisées, mais perd aussi la méta-capacité de les reconstruire
Notre matériel biologique humide est un système « use it or lose it » sans gestion de versions. Quand les fonctions cognitives complexes s’atrophient, le « code source » est endommagé. Il n’y a pas de git revert pour les réseaux neuronaux effondrés qui soutenaient la pensée profonde et structurée
Ce fil HN se concentre sur la rédaction d’essais, mais à plus grande échelle, nous menons une immense expérience incontrôlée d’externalisation de la cognition collective. Le résultat à long terme pourrait ne pas être une société de personnes moins qualifiées, mais une société de personnes structurellement incapables de pratiquer le type de pensée qui a créé notre monde
La question n’est donc pas « comment éviter la dette cognitive ? ». La vraie question terrifiante est : « si le contenant de l’esprit biologique est optimisé pour la paresse avec une telle brutalité, et peut-être de manière irréversible, quel contenant notre esprit exige-t-il ? »
https://github.com/dmf-archive/dmf-archive.github.io
- Chacun doit décider à quoi il utilise les LLM. Pour les tâches à forte friction et faible débit, par exemple faire des recherches en ligne avec de mauvais outils de recherche, les modèles de texte me semblent excellents
  Ils sont utiles pour poser des questions sur ce qu’on ne sait pas ou pour sauter les « passages ennuyeux ». En particulier, je n’ai absolument pas l’impression que parcourir des pages de forums ou de réseaux sociaux pour trouver la solution à un problème technique obscur me rende plus intelligent. De toute façon, il faut vérifier l’information et l’accepter avec prudence
  Un StackExchange tel qu’il était censé fonctionner aurait été bien plus précieux qu’un modèle de texte. Mais dans la réalité, les humains sont imparfaits, chargés de toutes sortes de biais cognitifs et de bagages, et un LLM ne ferme pas une question comme « trop large » juste après qu’elle a reçu des recommandations et des interactions
  À l’inverse, je trouve que la rédaction par LLM sur des sujets que je connais bien reste très inférieure. Par exemple, si je veux écrire un e-mail, je finis par passer à peu près autant de temps à corriger le prompt pour qu’il garde la bonne direction, ou à réécrire largement le résultat. Mieux vaut écrire directement dans mon propre flux que corriger ou relire un modèle de texte comme un pair
L’IA est l’inverse du Zettelkasten
Au lieu de travailler activement un sujet et d’en tirer des intuitions de plus en plus profondes, on itère rapidement mais superficiellement sur un corpus de contenus générés par l’IA.
Par exemple, voulant mieux comprendre la situation au Moyen-Orient, j’ai pris OpenAI comme coauteur et rédigé un essai de 10 pages sur les origines du Hamas et du Hezbollah.
Mais je ne me souviens de rien, et pire encore, je ne sais pas si ce dont je me souviens correspond à des hallucinations que j’ai corrigées ou à des faits réels.
- Les gens intelligents savent généralement que l’écriture consiste autant à penser qu’à obtenir un résultat écrit.
  Un LLM peut être un excellent sparring-partner si on l’utilise non pas comme un outil qui écrit à notre place, mais comme un outil qui aide à trouver des erreurs, à signaler des lacunes et des incohérences, et à explorer des questions générales sur le monde. Bien sûr, il faut toujours rester prudent et vérifier les sources.
- Je suis plutôt optimiste quant à l’utilité des LLM, mais je suis d’accord sur ce point.
  On développe bien une intuition sur la façon de piloter le modèle et de réduire les hallucinations, mais cela ne revient pas à accumuler des connaissances clairement explicables ni à mener une réflexion exigeante. C’est plutôt l’apprentissage de réactions de mémoire musculaire face à certaines formes de sorties de LLM : décider si on peut leur faire davantage confiance, s’il faut essayer une autre stratégie de prompt, s’il faut effacer le contexte, etc.
  Même si l’on peut appeler cela une compétence, il y a de fortes chances qu’elle devienne inutile d’ici quelques années à mesure que les modèles s’amélioreront. Cela donne le même sentiment d’impuissance qu’un ouvrier sur une chaîne d’assemblage pourrait ressentir.
- On a tendance à mieux se souvenir des parties qui ont posé problème que de celles qui se sont déroulées sans accroc ; je pense donc qu’on se souvient des parties qu’on a dû corriger soi-même.
- Je trouve intéressante cette vision de l’IA comme l’inverse de l’accès à une connaissance reliée, c’est-à-dire à un Zettelkasten.
Personnellement, le résultat ne me surprend pas. Quand j’utilise l’IA pour mes travaux d’écriture ou de traduction, je n’ai pas l’impression d’être aussi mentalement engagé dans le processus d’écriture ou de traduction que lorsque je fais tout moi-même.
Mais j’ai aussi constaté qu’en utilisant l’IA autrement, cela peut être en soi très mobilisateur intellectuellement. Depuis deux semaines, j’expérimente avec Claude Code pour voir jusqu’où il est possible d’automatiser complètement le brainstorming, la recherche et la rédaction d’essais et d’articles de recherche. J’ai été aussi profondément absorbé que lorsque j’écris ou traduis moi-même, mais la forme d’immersion est différente.
Les résultats de l’expérience sont pour l’instant assez bons. Autrement dit, même en sachant que ces essais et articles ont été écrits par un agent IA, leur lecture est souvent intéressante. Bien sûr, je n’ai pas l’intention de les publier ni de les partager.
- J’utilise les outils d’IA pour m’amuser ou pour des questions aléatoires, mais presque jamais pour du vrai travail.
  Je me demande si je ne vais pas finir par appartenir à un groupe de plus en plus rare, celui des gens réellement capables de faire quelque chose, tandis que les autres deviendront de plus en plus incompétents.
Le fait que « les participants du groupe LLM aient obtenu de moins bons résultats que le groupe Brain-only à tous les niveaux — activité cérébrale, langage et score » n’est pas surprenant, mais c’est sombre.
- Cela semble correspondre au vieux paradoxe de l’automatisation [1].
  Quand les humains se contentent de relire le résultat et d’y apposer un tampon, ils le font généralement très mal.
  Je pense depuis un moment que, pour créer un vrai workflow d’augmentation, le mode de participation est essentiel. Relire du code écrit par un LLM ? Pas terrible. Un LLM qui observe mes changements et me donne du feedback ? Là, c’est complètement différent. C’est difficile et peut-être pas très populaire, mais si nous ne trouvons pas un moyen de rester au volant, cela risque de devenir assez sinistre.
  [1]: https://en.m.wikipedia.org/wiki/Ironies_of_Automation
- « Nous devons renier les machines pensantes. Les humains doivent établir leurs propres directives. Ce n’est pas quelque chose qu’une machine peut faire. Le raisonnement ne dépend pas du matériel, mais de la programmation, et nous sommes le programme ultime ! Notre djihad est un “programme de vidage”. Il consiste à rejeter les choses qui nous détruisent en tant qu’humains ! »
  https://dune.fandom.com/wiki/Butlerian_Jihad
Depuis que je fais désormais l’essentiel du code avec l’IA, un effet secondaire un peu inattendu est que je suis beaucoup moins fatigué et que je peux rester concentré plus longtemps.
Cela me permet de travailler même lorsqu’il y a d’autres distractions. En gros, si l’on délègue une partie de sa capacité mentale à l’IA, cela libère de la capacité ailleurs.
- Pour moi, c’est tout l’inverse. Je suis devenu beaucoup plus productif, je fais plusieurs choses en parallèle, et à la fin de la journée je suis extrêmement fatigué, comme si mon cerveau avait tourné à 100 % de capacité.
- D’un côté, cela réduit la fatigue à court terme, mais si l’on n’y prend pas garde, il existe aussi un point d’inflexion où cela augmente la fatigue sur une échelle de temps plus longue.
  Avant, les erreurs inattendues ou la consultation de la documentation jouaient le rôle de « ralentisseurs » qui me permettaient de reprendre mon souffle, et c’est généralement à ce moment-là que je remarquais à quel point j’étais épuisé et que je faisais une pause.
  Avec l’IA, ces ralentisseurs existent toujours, mais parfois elle apporte un petit supplément d’élan qui m’empêche de ralentir suffisamment pour prendre conscience de ma fatigue.
  L’IA n’a même pas besoin d’avoir raison. Le simple fait de lire une suggestion adaptée à la situation en cours peut relancer mon fil de pensée, au point qu’il devient parfois difficile de le retenir.
- J’aime bien penser l’IA comme une voiture.
  On pourrait marcher jusqu’au Walmart en dehors de la ville, acheter ce dont on a besoin et rentrer en portant ses courses, mais avec une voiture c’est beaucoup plus rapide et moins épuisant. On peut alors consacrer davantage de temps de qualité à ce qu’on aime faire.
À l’époque où les GAN étaient à la mode, j’ai entraîné des modèles générateur-discriminateur pour la génération d’images.
Après y avoir beaucoup réfléchi, j’ai compris que discriminer est beaucoup plus facile que générer.
Par exemple, je peux distinguer une bonne UI d’une mauvaise, mais même si ma vie en dépendait, je serais incapable de créer une bonne UI. Je sais tout de suite si un film est bon, mais écrire une nouvelle correcte est un travail pénible.
Je peux juger du réalisme d’un dessin, mais je ne peux même pas dessiner un simple vélo de façon convaincante.
Dans beaucoup de cas, on peut juger si une production de LLM est bonne ou mauvaise. Une stratégie grossière consiste alors à jeter les mauvais résultats et à continuer à générer jusqu’à atteindre l’objectif. Si les LLM sont utiles, c’est précisément grâce à cet écart entre discrimination et génération.
Ces deux compétences sont distinctes. La capacité à générer est difficile à acquérir et très précieuse. Si on ne continue pas à l’entraîner, elle s’atrophiera.
- Dans les cas très simples, par exemple lorsqu’il s’agit de distinguer un dessin manifestement mauvais d’un bon dessin, je pense que c’est vrai.
  Mais ce n’est pas forcément le cas pour des tâches plus complexes, en particulier dans les domaines qui exigent une évaluation approfondie. Par exemple, relire 5 PR non triviales risque fort d’être plus difficile et plus long que de les écrire soi-même.
  Si cela fonctionne bien pour les images ou les histoires courtes, c’est parce que le filtre appliqué n’est pas « bon vs mauvais », mais ça me plaît vs ça ne me plaît pas.
Il est probable que nous apprenions à établir une relation plus saine avec ce type de technologie. Je ne connais pas le calendrier. Cela pourrait prendre des générations, ou arriver plus vite qu’on ne le pense
Il est clair que les modèles de langage sont de purs accélérateurs. Mais si la personne moyenne devient plus « éloquente », les signaux qui indiquent l’intelligence brute évolueront eux aussi avec le temps
Personne n’a envie d’avoir une relation avec un modèle de langage. Mais les modèles de langage peuvent aider des personnes qui ne sont pas prêtes à gérer de grands changements de vie et des revers. C’est un outil, il suffit de savoir s’en servir
Prenons un exemple concret : les conseils amoureux. Avec le temps, je pense que les « relations guidées par ChatGPT » se diviseront en deux catégories. D’un côté, le type « copier-coller », qui ne fait qu’ajouter de la complexité à une communication déjà déficiente — autrement dit, « j’ai juste copié ce que ChatGPT a dit ». De l’autre, le type « accéléré », qui utilise ChatGPT pour analyser ses propres motivations et celles de son ou sa partenaire afin de trouver de meilleures solutions à des problèmes courants
Pour bien juger le second cas, il faut toujours du cerveau et de l’empathie. Le premier finira toujours en chagrin d’amour. Je crois que les gens finiront par comprendre cette différence
- Je ne suis pas sûr de l’affirmation selon laquelle « personne n’a envie d’avoir une relation avec un modèle de langage »
  Je n’en ai pas fait l’expérience, directement ou indirectement, mais j’ai beaucoup entendu parler de cas où des gens tombent dans une forme de relation avec une IA, et j’en comprends dans une certaine mesure l’attrait. On peut avoir « quelqu’un » qui ne juge pas du tout, qui est toujours là quand on veut parler de soi, et qui n’exige rien de nous. Ce n’est pas du tout la même chose qu’une vraie relation, mais c’est objectivement mieux que les pires relations humaines, et peut-être meilleur pour la santé mentale que la solitude
  Pour le meilleur ou pour le pire, les relations humain-IA vont probablement se multiplier rapidement au cours des dix prochaines années. D’un côté, il y aura des progrès en matière de mémoire, de planification à long terme, et peut-être de corps robotiques ; de l’autre, la propagation de l’épidémie de solitude
C’est ce qu’on appelle le déchargement cognitif. Quiconque a travaillé assez longtemps avec des assistants de codage le reconnaîtra
- Ou même en travaillant comme engineering manager
  C’est une conséquence inévitable du travail à un niveau d’abstraction plus élevé. Ce n’est pas la fin du monde. Mes compétences en assembleur aussi se sont rouillées

La dette cognitive qui s’accumule lorsqu’on écrit un essai avec un assistant IA

Le coût cognitif des LLM mesuré dans la rédaction d’essais

Participants et conception des sessions

Méthodes de mesure

Résultats EEG : plus le soutien externe est important, plus la connectivité cérébrale baisse

Caractéristiques des essais révélées par l’analyse linguistique

Sentiment d’appropriation, mémoire et capacité de citation

Différences observées dans l’expérience de bascule à la 4e session

Conclusion et limites

À lire aussi

1 commentaires

Avis de Hacker News