« Le logiciel à l’ère de l’IA » - Vidéo de la conférence d’Andrej Karpathy à la YC AI School

(youtube.com)

29 points par GN⁺ 2025-06-19 | 2 commentaires | Partager sur WhatsApp

"Software is Changing (Again)"
Le paradigme logiciel connaît une transformation fondamentale pour la première fois en 70 ans, et a évolué rapidement ces dernières années vers Software 1.0 (code traditionnel), 2.0 (poids des réseaux neuronaux), 3.0 (LLM et prompts en langage naturel)
Les LLM ne sont pas de simples outils, mais un nouvel écosystème logiciel comparable à un système d’exploitation (Operating System), ouvrant une époque où chacun peut programmer un ordinateur en anglais ou dans d’autres langues naturelles
La collaboration avec les outils et agents IA, ainsi que l’« autonomie partielle » (Partial Autonomy), devient le cœur des futurs produits logiciels, avec une validation et un contrôle humains rapides pour garantir la fiabilité
L’IA et les LLM possèdent des caractéristiques de « people spirits », avec une mémoire et une capacité de connaissance immenses, mais aussi des limites propres comme les hallucinations, la perte de contexte et les risques de sécurité
À l’avenir, logiciels, documentation et infrastructure devront être repensés pour être « agent-friendly (LLMs-friendly) », afin que les LLM puissent comprendre et agir plus facilement grâce à une évolution de la structure et des modes d’expression

Software 1.0 → 2.0 → 3.0 : l’évolution du paradigme

Software 1.0 : le code source traditionnel écrit directement par des humains
Software 2.0 : des modèles créés en ajustant les poids (paramètres) de réseaux neuronaux à l’aide de jeux de données et d’optimizers
Software 3.0 : génération de programmes (instructions) via des prompts en langage naturel comme l’anglais, sur la base des grands modèles de langage (LLM)

Sur GitHub, le code évolue récemment vers une forme mêlant anglais et code, et l’anglais comme langage de programmation se diffuse rapidement
Hugging Face joue en quelque sorte le rôle de « GitHub » du Software 2.0 et mène l’écosystème open source des modèles

Les LLM sont un nouveau système d’exploitation (OS)

Les LLM évoluent au-delà du simple rôle d’API ou d’utilitaire pour devenir une plateforme sur laquelle fonctionne une grande variété de logiciels, comme un système d’exploitation
Aujourd’hui, leur usage s’inscrit dans une architecture centralisée orientée cloud, comparable à l’ère des mainframes des années 1960
À plus long terme, l’arrivée d’une ère des LLM personnels (usage distribué et local) est également évoquée
L’environnement d’usage des LLM ressemble aux interfaces traditionnelles de terminal et de ligne de commande, mais il n’existe pas encore de GUI véritablement universelle et mature

Capacités et limites des LLM

Les LLM disposent d’une mémoire immense et d’une grande capacité d’acquisition de connaissances, mais présentent aussi des défauts intrinsèques comme les hallucinations (fausses informations), la perte de mémoire contextuelle et des vulnérabilités de sécurité
Le « working memory » des LLM doit encore être géré explicitement par les humains, et l’apprentissage du contexte sur le long terme reste insuffisant
Des risques concrets, comme la sécurité ou le prompt injection, imposent une utilisation prudente

Autonomie partielle (Partial Autonomy) et collaboration humain-LLM

Des applications basées sur les LLM comme Cursor ou Perplexity évoluent vers une combinaison de manipulation manuelle traditionnelle et d’automatisation par LLM, autour de l’idée d’un « curseur d’autonomie » permettant d’ajuster le niveau de contrôle utilisateur / délégation à l’IA
L’audit via une GUI et des boucles de validation rapides, ainsi qu’une méthodologie consistant à « garder l’IA sous contrôle sur un périmètre court », deviennent indispensables en pratique
Il est prévu que les logiciels, produits et services renforcent progressivement leur « autonomisation partielle »

Cas concrets et culture du « Vibecoding »

Une culture du « Vibecoding », où chacun crée directement des applications avec un LLM en anglais, se diffuse largement
Karpathy partage aussi son expérience d’avoir créé en une seule journée une application iOS dans un langage qu’il ne maîtrisait pas (Swift), avant de l’étendre à un véritable service
Les LLM facilitent réellement le développement de prototypes, mais la mise en production effective (authentification, paiement, déploiement, etc.) reste encore un goulot d’étranglement dominé par le travail manuel et le DevOps
À l’avenir, le principal enjeu sera de concevoir des logiciels et une documentation « agent-friendly » afin que les parties nécessitant encore des clics et des réglages manuels puissent être prises en charge par des agents

Évolution de la documentation, de l’infrastructure et de l’agent-friendliness

La documentation existante, pensée pour les humains (clics, séquences, etc.), est difficilement exploitable directement par les LLM et les agents, d’où la nécessité de la réorganiser autour de Markdown et de commandes
Versell, Stripe et d’autres ont commencé à faire évoluer leur documentation vers un format plus adapté aux agents (par exemple avec des commandes curl)
Divers outils comme GitHub Ingest ou DeepWiki permettent de convertir dépôts de code et documentation dans une forme immédiatement exploitable par les LLM

Conclusion et perspectives

C’est aujourd’hui la meilleure période pour écrire énormément de nouveau code et en réécrire
Les LLM, en tant qu’outils d’assistance (« armure d’Iron Man »), collaboreront avec les développeurs humains, tandis qu’une innovation progressive mènera vers davantage d’autonomie
Au cours des 10 prochaines années, l’augmentation graduelle du « curseur d’autonomie » devrait devenir la tendance centrale
Les développeurs et les organisations doivent accélérer la refonte des logiciels, de la documentation et de l’infrastructure pour les optimiser pour les LLM et les agents

2 commentaires

laeyoung 2025-06-24

Cette vidéo est vraiment excellente ! En évoquant la phrase d’Andrew Ng, « AI Is the New Electricity », il explique que si ChatGPT, utilisé par 800 millions de personnes, tombe en panne, c’est comme si l’électricité était coupée, et ça m’a vraiment parlé.

GN⁺ 2025-06-19

Avis sur Hacker News

Impression que les analogies de Karpathy et sa façon de regarder la réalité avec justesse sont vraiment excellentes
Avis selon lequel la comparaison en parallèle entre le code traditionnel, les poids des réseaux neuronaux et les prompts est intéressante ; par exemple, dans un module de conduite autonome, optimiser un réseau neuronal sur un dataset qui représente bien la cible, plutôt que d’écrire directement le code, peut en pratique être assez utile. Mais il est aussi souligné que, dans de nombreux environnements, les contraintes matérielles limiteront fortement le champ d’application apporté par la « software 2.0 » ou la « software 3.0 ». Le code existant et les prompts resteront donc des outils complémentaires, et aucun des deux ne constituera une solution parfaite à lui seul
Éloge de Karpathy, présenté comme quelqu’un qui a toujours une pensée claire, avec la remarque que ses analogies sont marquantes ; après avoir vu que Waymo était déjà capable en 2013 d’une conduite autonome sans interruption, curiosité sur la raison pour laquelle l’expansion n’a pas été plus rapide : à cause de la régulation, ou de la difficulté d’optimiser la conduite ? Mention également d’une diapositive affichant « AGI 2027 », avec référence à ai-2027.com
Bref commentaire disant avoir été surpris que la présentation soit publiée bien plus tôt que prévu
Remerciement à YC d’avoir partagé la conférence avant qu’elle ne devienne dépassée, avec un lien vers le tweet associé (https://x.com/karpathy/status/1935077692258558443)