Ma méthode personnelle pour suivre l’évolution de l’IA (et pourquoi vous devriez absolument faire pareil)

(blog.nilenso.com)

87 points par GN⁺ 2025-07-21 | 5 commentaires | Partager sur WhatsApp

L’IA générative est la technologie qui évolue le plus vite, et il est dangereux à la fois de la sous-estimer et de la surestimer
Suivre régulièrement des sources faisant autorité et des experts fiables est indispensable
Recommandation d’un pipeline d’information équilibré, avec notamment Simon Willison’s Blog, Andrej Karpathy, Every’s Chain of Thought
Les annonces officielles des laboratoires d’IA, les blogs d’ingénierie et les articles de recherche sont essentiels pour comprendre les progrès réels de la technologie ainsi que ses limites
Grâce à des canaux variés comme Twitter/X, la curation d’actualités et des listes d’experts, on peut accéder à la fois aux dernières tendances et à des analyses approfondies

Introduction : malentendus autour de l’IA et pollution informationnelle

L’IA générative est, selon l’auteur, la technologie qui progresse le plus rapidement qu’il ait vue de sa vie
Mais les idées fausses sur l’IA sont elles aussi omniprésentes, et l’environnement informationnel lui-même est extrêmement confus
Il existe des cas bien réels où des entreprises, des gouvernements ou des individus qui ne comprennent pas suffisamment la technologie l’utilisent mal ou provoquent de graves dommages
On observe deux malentendus extrêmes : sous-estimer l’IA (« une mode passagère qui va bientôt disparaître ») ou la surestimer (« les programmeurs ne seront bientôt plus nécessaires »)
Le manque de bonne compréhension technique est à l’origine de ces contresens

Approche pour s’informer sur l’IA

Comprendre correctement les informations liées à l’IA est moins simple qu’on ne le pense
Nous évoluons dans un environnement où l’on est quotidiennement exposé à des informations déformées, exagérées ou à des discours étouffés
Sans tri intentionnel et méthodique, il est très facile de s’exposer aux erreurs, aux exagérations et aux distorsions
L’auteur explique qu’il s’appuie sur un pipeline d’information équilibré, qu’il recommande comme bon point de départ aux débutants

Principes généraux d’acquisition d’information

Il est important de s’appuyer sur des informations au plus près des sources primaires
- Il faut vérifier les annonces officielles des laboratoires d’IA ou les prises de position des figures majeures comme sources de première main
- Mieux vaut adopter une posture de méfiance vis-à-vis des reprises de seconde ou troisième main
Il faut aussi rechercher activement et consulter les commentaires d’experts fiables

Points de départ recommandés

Simon Willison’s Blog
- Simon Willison’s Blog (tag AI)
- Le point de départ le plus recommandé pour les techniciens, avec une couverture large de la frontière de l’IA, des usages, de la sécurité et des enjeux éthiques
- Également connu comme créateur de Django et Datasette
- Exemples : The Lethal Trifecta, LLMs in 2024
Andrej Karpathy
- Twitter/X | YouTube
- Membre fondateur d’OpenAI et ancien directeur de l’IA chez Tesla
- Une excellente source pour apprendre la structure interne et les principes des modèles d’IA de la façon la plus accessible, avec aussi des observations sur leur impact culturel et les changements sociaux qu’ils entraînent
- Exemples : Deep Dive into LLMs like ChatGPT, How I Use LLMs

Every’s Chain of Thought

Every’s Chain of Thought
Écrit par Dan Shipper (cofondateur d’Every), ce contenu propose des retours d’usage concrets de l’IA et une vision de terrain des modèles au-delà des seuls benchmarks
Exemples : Vibe Check: Codex, Vibe Check: o3

Comment suivre les publications officielles des laboratoires d’IA

OpenAI(News), Google DeepMind(DeepMind), Anthropic(News), Meta AI(Blog), xAI(News), Qwen(Activity) : consulter régulièrement leurs blogs officiels, actualités, model cards, guides d’ingénierie et articles de recherche
- Exemples : annonce officielle d’OpenAI o3, Claude 4 System Card
- Blogs d’ingénierie : Anthropic Engineering, OpenAI Voice Agent Guide, Gemini Cookbook
- Exemples d’articles : article DeepSeek R1, article Anthropic Biology
Laboratoires de plus petite taille : Nous Research, Allen AI, Prime Intellect, Pleias, Cohere, Goodfire peuvent également valoir le détour

Experts IA et ingénieurs terrain à suivre

Les informations partagées par des experts qui créent des outils open source et disposent d’une expérience concrète en ingénierie IA sont souvent plus utiles en pratique que les guides officiels

Figures et blogs particulièrement recommandés

Hamel Husain
- Your AI Product Needs Evals, LLM Eval FAQ
Shreya Shankar
- Data Flywheels for LLM Applications, Short Musings on AI Engineering and “Failed AI Projects”
Jason Liu
- The RAG Playbook, Common RAG Mistakes
Eugene Yan
- Task-Specific LLM Evals that Do & Don’t Work, AlignEval, Intuition on Attention
What We’ve Learned From A Year of Building with LLMs
- Archive de cas d’usage des LLM rédigée par des praticiens du déploiement réel
Chip Huyen
- Common pitfalls when building generative AI applications, Agents
Omar Khattab (Twitter)
- A Guide to Large Language Model Abstractions, post Twitter
Kwindla Hultman Kramer (Twitter)
- Voice AI and Voice Agents: An Illustrated Primer, Advice on Building Voice AI in June 2025
Han Chung Lee
- MCP is not REST API, Poking around Claude Code, MLOps Lessons from ChatGPT’s ‘Sycophantic’ Rollback
Jo Kristian Bergum
- Search is the natural abstraction for augmenting AI with moving context
David Crawshaw
- How I program with LLMs, How I program with Agents
Alexander Doria / Pierre Carl-Langlais
- The Model is the Product, A Realistic AI Timeline
Nathan Lambert’s “Interconnects”
- What comes next with Reinforcement Learning, Reinforcement learning with random rewards actually works with Qwen 2.5
Ethan Mollick
- Using AI Right Now: A Quick Guide, Making AI Work: Leadership, Lab, and Crowd
AI Snake Oil – Arvind Narayanan & Sayash Kapoor
- AGI is not a milestone, Evaluating LLMs is a minefield

Utiliser les actualités, médias et communautés IA

Twitter/X
- Liste Twitter/X
- Le centre névralgique des discussions en temps réel et de la veille IA, utile pour repérer rapidement informations et controverses
  - Lire son fil comme un journal pendant 15 à 20 minutes, puis ajouter si besoin de nouvelles personnes ou sources à suivre
Shawn Wang(swyx) / smol.ai
- Twitter de swyx | AI News by smol.ai
- newsletter Latent Space
- Fournit un résumé quotidien de l’actualité IA comme alternative à Twitter
Dwarkesh Patel
- blog/podcast de Dwarkesh Patel

Communautés pour discussions et ressources approfondies sur l’IA

LessWrong (AI Alignment), AI Alignment Forum : sécurité de l’IA, gouvernance, analyses techniques, etc.
- On y trouve beaucoup de discussions complexes rarement traitées sur Twitter ou dans les espaces plus grand public
- Exemples : Claude plays Pokémon breakdown, The Waluigi Effect
Gwern : textes de fond quasi encyclopédiques sur l’IA, les LLM et les transformers
- Propose une grande quantité d’articles sur l’IA et des analyses contenant des intuitions prospectives, notamment sur le scaling des LLM
- Exemples : The Scaling Hypothesis, You could have invented transformers tutorial
Prompt Whisperers/Latent space explorers
- blog Janus, Twitter de Wyatt Walls, Claude Backrooms
- Exemples : Anomalous tokens reveal the original identities of Instruct models, the void

Méthodes pratiques pour s’informer

Il n’est pas nécessaire de suivre parfaitement toutes les sources : l’approche la plus praticable consiste à lire son fil Twitter comme un journal
Lorsqu’on découvre un texte intéressant, il est recommandé de suivre son auteur puis d’explorer aussi ses autres travaux
C’est une manière d’explorer l’information comparable à la découverte musicale d’autrefois
Si on l’aborde comme un plaisir intellectuel, cela peut devenir une joie plutôt qu’une obligation

Conclusion et liste recommandée

La liste Twitter/X fournie permet de suivre d’un seul coup les experts et praticiens mentionnés ci-dessus
Une version au format RSS devrait être ajoutée prochainement

Lien direct vers la liste Twitter

5 commentaires

GN⁺ 2025-07-21

Avis Hacker News

Je pense que si l’on comprend globalement comment fonctionnent les LLM, il n’est pas nécessaire de suivre en permanence tout le contenu produit par les RP, les blogueurs, les leaders du secteur et les penseurs d’Internet
À force de suivre ces interviews ou ces articles, on risque surtout de courir après des modes étranges qui, en pratique, n’aident pas vraiment
En réalité, les différences entre les modèles n’ont souvent été qu’une question de quelques années d’écart, sans divergence fondamentale majeure ; aujourd’hui, la plupart des changements se font au niveau des outils ou de l’intégration
Il faut toujours garder en tête qu’un LLM reste au fond un « modèle de texte » généré sans connaissance sous-jacente ; cela permet de distinguer où il est utile et où il ne l’est pas
- Je suis vraiment d’accord avec cet avis ; j’ai aussi eu l’impression que la liste « high signal » de ce blog était en fait surtout composée de figures d’auto-promotion (même s’il y a bien sûr quelques bonnes personnes), avec quelque chose de plus proche du buzz que du vrai recul
  Je ne partage pas non plus vraiment l’idée selon laquelle « l’IA a été la technologie qui a le plus progressé de toute ma vie »
  J’ai connu l’époque où les SVM montaient, où les réseaux neuronaux étaient traités comme une blague, puis l’explosion du deep learning et la multiplication rapide des frameworks DL sur une dizaine d’années
  Là aussi, il y a eu des avancées extrêmement rapides sur dix ans
  Sur le web, c’était comparable au passage de JS simple outil d’amélioration UX à la standardisation des applications monopage
  Le fond du sujet, c’est que si vous ne cherchez pas à figurer sur une « liste d’influenceurs clés », il vaut bien mieux avancer tranquillement et attendre le moment où cela devient réellement important pour vous
  Moi aussi, après l’époque de backbone.js, j’ai ignoré toutes les tendances du développement web pendant 10 ans, puis quand React est devenu nécessaire, quelques jours d’étude ont suffi pour m’y mettre immédiatement
  Il y a 5 ans, tout le monde voulait encore apprendre à implémenter des LSTM, alors qu’aujourd’hui c’est devenu dépassé à cause des transformers
  Ce que j’ai ressenti tout au long de ma carrière, c’est que « ça bouge vite » veut dire que ce n’est pas mûr
  Au contraire, apprendre les anciens modèles statistiques (GLM, etc.) et leurs usages encore réellement pratiques apporte souvent des solutions bien plus productives dans le travail quotidien que de courir après le « prompt hack » à la mode
- Dès qu’on comprend à peu près l’architecture des LLM, la plupart des nouveautés sur les LLM tombent en gros dans deux catégories
  La première, ce sont de nouveaux outils un peu différents des précédents, ou avec des performances légèrement meilleures (s’ils apportent vraiment une fonction inédite, cela peut valoir le coup, mais la plupart deviennent vite obsolètes)
  Des noms comme Kimi-K2 ou GPT 4.1 peuvent très bien n’être plus mentionnés par personne dans quelques mois
  La seconde, ce sont les cas où de nouvelles capacités sont réellement ajoutées au modèle
  Par exemple : le RL (reinforcement learning), le chain of thought, les agents de code qui fonctionnent vraiment, les modèles multimodaux de très haut niveau, ou des intégrations d’outils intelligentes
  Il suffit de prêter attention quand ce type de grand saut se produit
  En pratique, parcourir les posts HN à plus de 500 points suffit déjà à capter naturellement les tendances récentes
  À mon avis, la meilleure façon d’apprendre les vraies capacités des LLM n’est ni les blogs ni les vidéos, mais l’expérience directe : construire des choses et se confronter au réel
- Entièrement d’accord. C’est ce que je répète toujours à mes étudiants
  - 1. Ne vous absorbez pas excessivement dans l’expérience des autres ; concentrez-vous sur votre propre expérience directe
  - 2. Au lieu de lire des blogs, construisez vous-mêmes une application
  - 3. Les expériences de chacun diffèrent énormément, donc ne suivez pas telles quelles les idées des autres
  - 4. Ne suivez pas aveuglément les chercheurs ou développeurs sur Twitter ou Substack (la plupart font surtout leur propre vitrine)
  - 5. Ne perdez pas votre temps dans l’anxiété ou le FOMO ; apprenez en pratiquant. Les changements vraiment importants, vous finirez forcément par en entendre parler tôt ou tard
  - 6. Il est important d’être informé, mais il ne faut pas s’attacher de manière obsessionnelle à l’information elle-même. Répartissez votre temps intelligemment. J’insiste toujours sur ce point auprès des étudiants
- En réalité, c’est pareil dans la recherche
  La recherche, à l’origine, c’est 99 % de progression incrémentale (et c’est une bonne chose ; il ne faut pas s’en décourager)
  La plupart des articles sont plus longs que nécessaire et, quand on les lit sérieusement, une bonne intuition mathématique permet souvent d’en anticiper une partie (si on comprend l’idée, on peut déjà pressentir les résultats)
  Il est facile d’avoir l’impression qu’un domaine change à toute vitesse, mais en pratique ce n’est pas si rapide que ça
  Moi aussi, quand je suis revenu après une année d’arrêt pour raisons personnelles, j’ai constaté qu’au fond, peu de choses avaient réellement changé
  Cette perspective permet de se libérer de la pression de « rester à niveau »
  Si c’est difficile en ce moment, cela veut surtout dire que votre expertise n’est pas encore assez solide, pas que vous êtes en retard
  De la même manière qu’il faut déjà savoir courir pour pouvoir suivre même avec un pas de retard, cette précipitation n’est souvent qu’une inquiétude dans notre propre tête
- Quand j’explique les LLM, ce qui intéresse le plus les gens n’est pas tant l’architecture que l’idée de la « prédiction token par token (autorégression) » et le fait qu’on ne prend pas forcément le token le plus probable, mais qu’on échantillonne selon les probabilités
  L’algorithme central lui-même (la façon de prédire le token suivant) parle assez peu à la plupart des non-spécialistes
  Les détails comme le dot product ou les embeddings, personne ne s’en soucie vraiment. Même en les expliquant, cela reste difficile à retenir et pas si utile
Il n’est pas nécessaire de suivre absolument les « dernières tendances » ; je pense qu’il vaut mieux garder un intérêt détendu, tester sélectivement les fonctions et techniques qui peuvent réellement améliorer mon efficacité, et accumuler seulement ce qui m’est utile (je fais peu confiance au fait que quelqu’un ait recommandé telle ou telle chose sur X). Au contraire, j’ai beaucoup appris en écoutant des chercheurs plus critiques envers l’emballement autour de l’IA [https://x.com/burkov]. Il y a actuellement trop d’exagération, trop de changements et trop d’incertitude. Si une vraie innovation apparaît, on en entendra forcément parler sur HN (ou dans les grandes communautés généralistes)
- Même y consacrer quelques heures directement vaut bien plus, en apprentissage, que de passer plusieurs heures à lire des ressources
J’ai trouvé que l’article expliquait mal le « pourquoi », ce qui rendait le « comment » de la liste moins convaincant. Mon temps précieux peut être utilisé ailleurs sans problème
- Je me demande vraiment s’il faut « continuer à suivre » tout cela. Les innovations réellement significatives finissent de toute façon par se démocratiser et arriver naturellement jusqu’à moi. Par exemple, Excel ou Google Docs ne m’intéressaient pas particulièrement au début, et pourtant je les ai très bien adoptés une fois devenus grand public. Sauf cas où il y a une raison claire de courir, comme une startup IA dont la runway touche à sa fin, il n’y a pas lieu de paniquer
Je suis abonné à la newsletter « Pragmatic Engineer » de Gergely Orosz (qui parle beaucoup d’IA ces temps-ci), et je consulte aussi le Substack de Gary Marcus (avec un point de vue plus sceptique sur les LLM)
https://newsletter.pragmaticengineer.com/
https://substack.com/@garymarcus
Je suis aussi automatiquement les actualités de packages Python comme Langchain ou PydanticAI (ce genre de projets reflète assez bien certaines tendances concrètes du secteur). Je n’utilise plus X (Twitter), mais des personnes comme Simon Willison publient aussi parfois sur BlueSky et Mastodon. Sebastian Raschka, Chip Huyen et d’autres postent aussi sur LinkedIn. C’est dispersé un peu partout, mais au final on finit quand même par voir passer l’essentiel des nouvelles importantes
J’ai peut-être raté des choses importantes, mais les mises à jour vraiment centrales et significatives finissent naturellement par être mentionnées sur la page principale de HN ou dans les commentaires
- Essayer de suivre les tendances du secteur, c’est comme monter sur un tapis roulant qui tourne à 140 km/h. J’ai simplement renoncé à courir. Je suis d’accord sur le fait que l’IA (et surtout les LLM) n’est pas une mode passagère, mais en ce moment les changements sont trop violents. Je ne compte pas y investir beaucoup de temps tant que cela ne deviendra pas réellement nécessaire. D’ici quelques années, j’espère que le paysage du secteur sera plus clair. Et même si ce n’est pas le cas, au moins je n’aurai pas gaspillé mon temps sur des tendances appelées à devenir vite insignifiantes. Pour information, je n’utilise actuellement ni l’IA ni les LLM dans mon travail au quotidien
- Vu les énormes investissements et efforts de R&D consentis par les entreprises, elles cherchent plutôt à exposer leur technologie qu’à la cacher (c’est presque l’inverse du secret)
- J’aborde d’ailleurs de cette manière toutes les tendances du secteur IT
Si l’on veut surtout suivre l’actualité des LLM et des modèles d’IA de pointe, la liste de recommandations est excellente ; plus de la moitié des personnes citées, je les avais aussi trouvées de mon côté
Je suis une liste de comptes IA sur X (Twitter), et globalement c’est la source d’information la plus robuste
Certains blogs et flux RSS de podcasts valent aussi le détour (et pour les chercheurs, les flux RSS d’articles sont indispensables)
J’ajouterais https://epoch.ai, le podcast de Dwarkesh Patel, le blog de Peter Wildeford, @omarsar0 (DAIR elvis), ainsi que le suivi direct de divers chercheurs (dont certains sont plus divertissants qu’informatifs)
L’environnement informationnel de ce domaine est gravement pollué. En particulier, si l’on suit seulement des médias comme le NYT, qui traitent surtout le sujet sous un angle politique, on finit au contraire avec une vision biaisée et inexacte
À noter que pour les domaines du ML non directement liés à l’IA générative (par exemple les protéines, la génomique, les modèles météo, ou la recherche sur la diffusion et la génération d’images), les sources d’information sont totalement différentes
La catégorie IA/ML est bien trop vaste pour tout suivre d’un seul bloc
Faut-il absolument suivre tout cela ? Non
Pour la plupart des gens, c’est surtout de la curiosité pour les nouvelles technologies et les tendances récentes
Cela dit, dans un domaine comme le développement logiciel, ignorer complètement l’IA pourrait devenir très problématique pour une carrière à moyen et long terme (même une approche centrée simplement sur l’apprentissage des outils peut suffire)
Pour ma part, comme mon travail m’oblige à garder une vision d’ensemble, je continue à suivre cela régulièrement
Le blog de Simon Willison suffit à lui seul pour apprendre des informations récentes de haute qualité (presque aucun bruit, excellent rapport signal/bruit)
- En soutenant Simon sur GitHub (10 $ ou plus), on peut recevoir par e-mail « moins de contenu, mais les résumés essentiels »
  
  « Résumé des évolutions les plus importantes du domaine des LLM au cours du mois écoulé (lecture en moins de 10 minutes) »
  https://simonwillison.net/about/
- https://simonwillison.net
- Heureusement, il propose aussi un flux RSS, ce qui permet de suivre à la fois le code et l’actualité
Pas besoin de suivre à tout prix les « tendances »
- Oui, c’est peut-être le moment d’arrêter et de faire autre chose
- En réalité, quitter complètement la tech pour construire une nouvelle carrière est aussi une option
  Les métiers de la tech se raréfient, et finiront peut-être par diminuer brutalement un jour (si l’IA permet à une seule personne de faire le travail de dix, alors la même chose pourrait ensuite toucher les cols blancs, puis les cols bleus, comme avec les robots dans les entrepôts Amazon)
  Personnellement, j’ai annulé mon abonnement GPT Plus cette semaine ; je n’ai plus envie de nourrir « ce monstre »
  Pour des fonctions comme l’aide cartographique (itinéraires de voyage, circuits à vélo avec des amis, etc.), la version gratuite de Gemini fait même mieux
Suivre uniquement la première recommandation (lire le blog de simow) suffit largement dans la plupart des cas
- Même cela me demande trop d’effort, donc je remplace ça par les vidéos de Fireship avec mon café du matin
- Je recommande vivement : très bons résumés, avec très peu de clickbait
Les cours d’Andrej Karpathy m’ont énormément aidé
Ils sont aussi disponibles sur YouTube (https://www.youtube.com/@AndrejKarpathy)
J’étais dans une position où j’aidais et mentorais des chercheurs en machine learning, mais quand j’écoute Andrej, j’ai l’impression d’être un étudiant qui ne connaît rien
Au début, c’était étrange, mais aujourd’hui je considère que cette humilité est en elle-même un atout très précieux
Cet état d’esprit de « je ne sais rien » est vraiment important

makers 2025-07-22

snif snif c’est vraiment illisible

reagea0 2025-07-23

Si vous trouvez ce niveau difficile à lire, le problème ne vient probablement pas du corps de l’article.

harris 2025-07-28

Je suis d’accord.

supermaxi 2025-07-22

Un type d’écriture essentiel en ce moment.