18 points par kciter1 2026-04-06 | 17 commentaires | Partager sur WhatsApp
  • Avec les progrès fulgurants de l’IA, de plus en plus de développeurs ressentent une forme de déprime psychologique liée au remplacement de leur expertise
  • Comme ce malaise touche un grand nombre de développeurs, on a fini par lui donner le nom de Claude Blue
  • De plus, le flot quotidien de nouveaux termes accentue encore le FOMO et l’anxiété des développeurs
  • La clé pour surmonter cette peur, c’est de comprendre
  • Une grande partie de ce qu’on appelle aujourd’hui « engineering » n’est au fond qu’une variation du processus consistant à envoyer la bonne entrée à une API et à traiter la réponse, quelque chose que les développeurs savent déjà très bien faire
  • Au lieu de se laisser emporter par les contenus qui alimentent le FOMO, comprendre l’essentiel permet d’évaluer lucidement les nouveaux termes en les replaçant dans son cadre de connaissances existant

Structure de la peur et comment la surmonter

  • L’être humain ressent de la peur face à ce dont il ne connaît pas la nature. La peur de l’IA vient elle aussi moins de l’IA elle-même que du fait de « ne pas savoir comment elle fonctionne »
  • Une fois sa nature comprise, la magie commence à apparaître comme de la technologie, et la technologie est par définition quelque chose qu’on peut apprendre et qui a des limites
  • Une étude indique également que 24 % des salariés ont vu leur santé mentale se dégrader à cause de la surcharge informationnelle liée à l’IA

La vraie nature des LLM

  • Un LLM est un modèle de prédiction du mot suivant qui « génère la sortie la plus appropriée pour une entrée donnée »
  • ChatGPT, Claude et Gemini fonctionnent tous selon le même principe, et la réalité du service se résume à un appel d’API HTTP où le client envoie un message et le modèle renvoie des tokens en streaming
  • Même les puissantes capacités de codage des agents IA ne sont qu’un habillage autour de cet appel d’API

Comment les agents IA sont devenus plus intelligents

  • Prompt engineering : attribution d’un rôle, Few-Shot, Chain-of-Thought, etc. reviennent au fond à rendre le contexte du texte d’entrée plus précis afin d’orienter la sortie dans une direction donnée
  • Contrôle du format de sortie : avec JSON Schema, Function Calling, etc., on transforme la sortie du modèle en une structure que le programme peut parser. Grâce au Function Calling, il devient possible d’avoir une architecture où le modèle appelle des outils et où le runtime les exécute. MCP et RAG sont aussi une forme d’appel d’outils
  • Context engineering : il ne s’agit pas de savoir comment poser la question, mais de concevoir ce que le modèle verra avant de raisonner. Comme l’attention diminue quand l’entrée devient trop longue, l’essentiel est de placer les bonnes informations au bon endroit
  • Découpage des prompts : au lieu d’un seul prompt gigantesque, on répartit le traitement entre plusieurs prompts petits et ciblés. Les Sub-Agent et les Skill entrent dans cette catégorie
  • Harness engineering : il s’agit de concevoir l’ensemble de l’environnement d’exécution autour du modèle. Cela se compose de guides (orientation avant l’action) et de capteurs (vérification du résultat après l’action)
    • Ralph loop : technique consistant à réinjecter le même prompt tant que les critères d’achèvement ne sont pas remplis. L’avancement est sauvegardé dans le système de fichiers et dans git, ce qui permet de reprendre à chaque fois même avec un nouveau contexte. Ce n’est qu’une sous-stratégie du harness, et non le harness lui-même
    Publicité

Sortir du FOMO

  • Si l’on reste anxieux malgré les connaissances, c’est parce que les producteurs de FOMO nous donnent l’impression que nous ne savons rien
  • Une bonne manière de ne plus ressentir le FOMO consiste à regarder ce qu’ils ont réellement résolu
    • Le plus souvent, ils ont compressé le processus, mais n’ont pas résolu le problème lui-même
  • Quand on comprend l’essentiel, on devient capable, face à une nouvelle information, de juger par soi-même s’il s’agit d’un nouveau paradigme, d’une variation d’un concept existant ou d’une exagération

Que faire à partir de maintenant

  • Il n’est pas forcément nécessaire de faire quoi que ce soit. Si l’IA n’aide pas à résoudre votre problème, vous pouvez simplement continuer comme avant. Au final, ce n’est qu’un outil : utilisez-le si vous en avez besoin, sinon abstenez-vous
  • Il n’existe pas de bonne réponse à tout. Il n’est donc pas nécessaire de chercher un corrigé.
  • Si l’on a les connaissances, alors même lorsque de nouveaux termes apparaîtront, on développera le discernement nécessaire pour comprendre de quoi il est réellement question

17 commentaires

 
pjs102793 2026-04-07

Une bonne façon d’éviter de ressentir le FOMO, c’est d’examiner ce que ceux qui le suscitent ont réellement résolu grâce à l’IA.

Je trouve que ça résonne vraiment beaucoup avec moi, haha

 
bluekai17 2026-04-13

« Si l’IA ne m’aide pas pour mes problèmes, je peux simplement continuer à vivre comme avant. Au final, ce n’est qu’un outil : on l’utilise quand on en a besoin, et quand ce n’est pas le cas, on ne l’utilise pas. » Ce n’est pas si simple, soupir.

 
limhasic 2026-04-07

Hihi, maintenant je fais quoi ?

 
savvykang 2026-04-06

L’ensemble de l’expertise n’est pas remplaçable, non ? Le processus même de création du terme est étrange.

 
kciter1 2026-04-06

Je n’ai jamais affirmé dans le texte original que l’IA pouvait remplacer l’ensemble de l’expertise. Moi non plus, je ne le pense pas...

 
brainer 2026-04-06

Un LLM est un modèle de prédiction du mot suivant qui « génère la sortie la plus appropriée pour une entrée donnée ».

On parle de GPT-3, là.

 
jmg008 2026-04-06

Je pensais que, parmi les grands modèles de langage commercialisés après GPT, à l’exception de quelques-uns qui utilisent des modèles de diffusion, tous fonctionnaient sous la forme d’une prédiction du token suivant. S’il existe des modèles qui fonctionnent autrement, je vous serais reconnaissant de me le faire savoir.

 
kciter1 2026-04-06

Alors, le dernier modèle est-il différent ? S’il y a des informations erronées, merci de me le signaler, cela pourrait être utile à d’autres personnes, moi y compris, haha.

 
brainer 2026-04-06

Si vous réduisez les LLM modernes à de la « prédiction du mot suivant », alors AlphaGo aussi ne serait rien d’autre que de la « prédiction du coup suivant ».

Depuis ChatGPT, la prédiction du mot suivant n’est rien de plus qu’un simple pre-trained.

Constitutional AI, en revanche, est un modèle qui atteint un objectif.

 
cafedead 2026-04-06

AlphaGo aussi ne prédit-il pas le coup suivant calculé comme ayant la probabilité de victoire la plus élevée ?????

 
cafedead 2026-04-06

C’est confus. Vous plaisantez, ou bien est-ce qu’une nouvelle méthode ou technologie est apparue sans que je le sache ??

 
brainer 2026-04-06

Le « taux de victoire » est l’élément clé.
Avec une simple prédiction du mot suivant, on n’arrive même pas à produire des phrases vraiment utiles, encore moins à faire correctement du code ou des maths.
Ce genre de technique date des années 60 à 70.

(À proprement parler, ce ne sont même pas des mots.)

 
kciter1 2026-04-06

Hum… je me dis qu’il est possible que mon texte ait été perçu autrement que je ne l’avais voulu. Si vous avez eu l’impression, à la lecture de ce message, que je minimisais la valeur technique des LLM, je m’en excuse.

Cela dit, l’intention de ce texte était de retirer l’emballage excessif et la mystification pour regarder les choses avec sang-froid. C’est pourquoi, personnellement, l’expression « un modèle qui atteint des objectifs » me donne l’impression de participer à cette mystification. Au fond, qu’il s’agisse d’un logiciel classique ou d’un modèle, les deux servent aussi à atteindre un certain « objectif ».

J’aimerais donc, par curiosité personnelle, vous reposer la question : l’expression que vous avez employée est-elle vraiment plus exacte d’un point de vue technique ?

 
h0422ys 2026-04-06

gpt 3 : prédiction du mot suivant -> correct
gpt 3 et les modèles basés sur les transformeurs qui ont suivi : prédiction du mot suivant -> correct.
AlphaGo, AlphaZero, MuZero, ... : prédiction du coup suivant -> correct.
Modèle visant à atteindre un objectif (spécifique) -> correct.

Il n’y a rien d’erroné dans ce qui a été dit.

 
rlaaudgjs5638 2026-04-06

C’est un peu ça aussi, oui.
Mais au fond, le modèle lui-même n’est finalement qu’une fonction d’entrée/sortie.
En supposant qu’on dispose d’un harnais approprié et d’une boucle d’agent, il semble alors juste de dire que le modèle atteint l’objectif.

 
blacksocks 2026-04-06

Peut-on résumer cela ainsi : « la prédiction du token suivant » est une description exacte au niveau de l’implémentation, mais incomplète comme manière d’expliquer les capacités ou la finalité du modèle ?

 
ng0301 2026-04-06

Alors, je pense qu’il faudrait trouver un terrain d’entente avec un modèle qui prédit mieux 😄