- L’IA générative est la technologie qui évolue le plus vite, et il est dangereux à la fois de la sous-estimer et de la surestimer
- Suivre régulièrement des sources faisant autorité et des experts fiables est indispensable
- Recommandation d’un pipeline d’information équilibré, avec notamment Simon Willison’s Blog, Andrej Karpathy, Every’s Chain of Thought
- Les annonces officielles des laboratoires d’IA, les blogs d’ingénierie et les articles de recherche sont essentiels pour comprendre les progrès réels de la technologie ainsi que ses limites
- Grâce à des canaux variés comme Twitter/X, la curation d’actualités et des listes d’experts, on peut accéder à la fois aux dernières tendances et à des analyses approfondies
Introduction : malentendus autour de l’IA et pollution informationnelle
- L’IA générative est, selon l’auteur, la technologie qui progresse le plus rapidement qu’il ait vue de sa vie
- Mais les idées fausses sur l’IA sont elles aussi omniprésentes, et l’environnement informationnel lui-même est extrêmement confus
- Il existe des cas bien réels où des entreprises, des gouvernements ou des individus qui ne comprennent pas suffisamment la technologie l’utilisent mal ou provoquent de graves dommages
- On observe deux malentendus extrêmes : sous-estimer l’IA (« une mode passagère qui va bientôt disparaître ») ou la surestimer (« les programmeurs ne seront bientôt plus nécessaires »)
- Le manque de bonne compréhension technique est à l’origine de ces contresens
Approche pour s’informer sur l’IA
- Comprendre correctement les informations liées à l’IA est moins simple qu’on ne le pense
- Nous évoluons dans un environnement où l’on est quotidiennement exposé à des informations déformées, exagérées ou à des discours étouffés
- Sans tri intentionnel et méthodique, il est très facile de s’exposer aux erreurs, aux exagérations et aux distorsions
- L’auteur explique qu’il s’appuie sur un pipeline d’information équilibré, qu’il recommande comme bon point de départ aux débutants
Principes généraux d’acquisition d’information
- Il est important de s’appuyer sur des informations au plus près des sources primaires
- Il faut vérifier les annonces officielles des laboratoires d’IA ou les prises de position des figures majeures comme sources de première main
- Mieux vaut adopter une posture de méfiance vis-à-vis des reprises de seconde ou troisième main
- Il faut aussi rechercher activement et consulter les commentaires d’experts fiables
Points de départ recommandés
-
Simon Willison’s Blog
-
Andrej Karpathy
- Twitter/X | YouTube
- Membre fondateur d’OpenAI et ancien directeur de l’IA chez Tesla
- Une excellente source pour apprendre la structure interne et les principes des modèles d’IA de la façon la plus accessible, avec aussi des observations sur leur impact culturel et les changements sociaux qu’ils entraînent
- Exemples : Deep Dive into LLMs like ChatGPT, How I Use LLMs
Every’s Chain of Thought
Comment suivre les publications officielles des laboratoires d’IA
- OpenAI(News), Google DeepMind(DeepMind), Anthropic(News), Meta AI(Blog), xAI(News), Qwen(Activity) : consulter régulièrement leurs blogs officiels, actualités, model cards, guides d’ingénierie et articles de recherche
- Laboratoires de plus petite taille : Nous Research, Allen AI, Prime Intellect, Pleias, Cohere, Goodfire peuvent également valoir le détour
Experts IA et ingénieurs terrain à suivre
- Les informations partagées par des experts qui créent des outils open source et disposent d’une expérience concrète en ingénierie IA sont souvent plus utiles en pratique que les guides officiels
Figures et blogs particulièrement recommandés
Utiliser les actualités, médias et communautés IA
-
Twitter/X
- Liste Twitter/X
- Le centre névralgique des discussions en temps réel et de la veille IA, utile pour repérer rapidement informations et controverses
- Lire son fil comme un journal pendant 15 à 20 minutes, puis ajouter si besoin de nouvelles personnes ou sources à suivre
-
Shawn Wang(swyx) / smol.ai
-
Dwarkesh Patel
Communautés pour discussions et ressources approfondies sur l’IA
Méthodes pratiques pour s’informer
- Il n’est pas nécessaire de suivre parfaitement toutes les sources : l’approche la plus praticable consiste à lire son fil Twitter comme un journal
- Lorsqu’on découvre un texte intéressant, il est recommandé de suivre son auteur puis d’explorer aussi ses autres travaux
- C’est une manière d’explorer l’information comparable à la découverte musicale d’autrefois
- Si on l’aborde comme un plaisir intellectuel, cela peut devenir une joie plutôt qu’une obligation
Conclusion et liste recommandée
- La liste Twitter/X fournie permet de suivre d’un seul coup les experts et praticiens mentionnés ci-dessus
- Une version au format RSS devrait être ajoutée prochainement
Lien direct vers la liste Twitter
5 commentaires
Avis Hacker News
Je pense que si l’on comprend globalement comment fonctionnent les LLM, il n’est pas nécessaire de suivre en permanence tout le contenu produit par les RP, les blogueurs, les leaders du secteur et les penseurs d’Internet
À force de suivre ces interviews ou ces articles, on risque surtout de courir après des modes étranges qui, en pratique, n’aident pas vraiment
En réalité, les différences entre les modèles n’ont souvent été qu’une question de quelques années d’écart, sans divergence fondamentale majeure ; aujourd’hui, la plupart des changements se font au niveau des outils ou de l’intégration
Il faut toujours garder en tête qu’un LLM reste au fond un « modèle de texte » généré sans connaissance sous-jacente ; cela permet de distinguer où il est utile et où il ne l’est pas
Je ne partage pas non plus vraiment l’idée selon laquelle « l’IA a été la technologie qui a le plus progressé de toute ma vie »
J’ai connu l’époque où les SVM montaient, où les réseaux neuronaux étaient traités comme une blague, puis l’explosion du deep learning et la multiplication rapide des frameworks DL sur une dizaine d’années
Là aussi, il y a eu des avancées extrêmement rapides sur dix ans
Sur le web, c’était comparable au passage de JS simple outil d’amélioration UX à la standardisation des applications monopage
Le fond du sujet, c’est que si vous ne cherchez pas à figurer sur une « liste d’influenceurs clés », il vaut bien mieux avancer tranquillement et attendre le moment où cela devient réellement important pour vous
Moi aussi, après l’époque de backbone.js, j’ai ignoré toutes les tendances du développement web pendant 10 ans, puis quand React est devenu nécessaire, quelques jours d’étude ont suffi pour m’y mettre immédiatement
Il y a 5 ans, tout le monde voulait encore apprendre à implémenter des LSTM, alors qu’aujourd’hui c’est devenu dépassé à cause des transformers
Ce que j’ai ressenti tout au long de ma carrière, c’est que « ça bouge vite » veut dire que ce n’est pas mûr
Au contraire, apprendre les anciens modèles statistiques (GLM, etc.) et leurs usages encore réellement pratiques apporte souvent des solutions bien plus productives dans le travail quotidien que de courir après le « prompt hack » à la mode
La première, ce sont de nouveaux outils un peu différents des précédents, ou avec des performances légèrement meilleures (s’ils apportent vraiment une fonction inédite, cela peut valoir le coup, mais la plupart deviennent vite obsolètes)
Des noms comme Kimi-K2 ou GPT 4.1 peuvent très bien n’être plus mentionnés par personne dans quelques mois
La seconde, ce sont les cas où de nouvelles capacités sont réellement ajoutées au modèle
Par exemple : le RL (reinforcement learning), le chain of thought, les agents de code qui fonctionnent vraiment, les modèles multimodaux de très haut niveau, ou des intégrations d’outils intelligentes
Il suffit de prêter attention quand ce type de grand saut se produit
En pratique, parcourir les posts HN à plus de 500 points suffit déjà à capter naturellement les tendances récentes
À mon avis, la meilleure façon d’apprendre les vraies capacités des LLM n’est ni les blogs ni les vidéos, mais l’expérience directe : construire des choses et se confronter au réel
La recherche, à l’origine, c’est 99 % de progression incrémentale (et c’est une bonne chose ; il ne faut pas s’en décourager)
La plupart des articles sont plus longs que nécessaire et, quand on les lit sérieusement, une bonne intuition mathématique permet souvent d’en anticiper une partie (si on comprend l’idée, on peut déjà pressentir les résultats)
Il est facile d’avoir l’impression qu’un domaine change à toute vitesse, mais en pratique ce n’est pas si rapide que ça
Moi aussi, quand je suis revenu après une année d’arrêt pour raisons personnelles, j’ai constaté qu’au fond, peu de choses avaient réellement changé
Cette perspective permet de se libérer de la pression de « rester à niveau »
Si c’est difficile en ce moment, cela veut surtout dire que votre expertise n’est pas encore assez solide, pas que vous êtes en retard
De la même manière qu’il faut déjà savoir courir pour pouvoir suivre même avec un pas de retard, cette précipitation n’est souvent qu’une inquiétude dans notre propre tête
L’algorithme central lui-même (la façon de prédire le token suivant) parle assez peu à la plupart des non-spécialistes
Les détails comme le dot product ou les embeddings, personne ne s’en soucie vraiment. Même en les expliquant, cela reste difficile à retenir et pas si utile
Il n’est pas nécessaire de suivre absolument les « dernières tendances » ; je pense qu’il vaut mieux garder un intérêt détendu, tester sélectivement les fonctions et techniques qui peuvent réellement améliorer mon efficacité, et accumuler seulement ce qui m’est utile (je fais peu confiance au fait que quelqu’un ait recommandé telle ou telle chose sur X). Au contraire, j’ai beaucoup appris en écoutant des chercheurs plus critiques envers l’emballement autour de l’IA [https://x.com/burkov]. Il y a actuellement trop d’exagération, trop de changements et trop d’incertitude. Si une vraie innovation apparaît, on en entendra forcément parler sur HN (ou dans les grandes communautés généralistes)
J’ai trouvé que l’article expliquait mal le « pourquoi », ce qui rendait le « comment » de la liste moins convaincant. Mon temps précieux peut être utilisé ailleurs sans problème
Je suis abonné à la newsletter « Pragmatic Engineer » de Gergely Orosz (qui parle beaucoup d’IA ces temps-ci), et je consulte aussi le Substack de Gary Marcus (avec un point de vue plus sceptique sur les LLM)
https://newsletter.pragmaticengineer.com/
https://substack.com/@garymarcus
Je suis aussi automatiquement les actualités de packages Python comme Langchain ou PydanticAI (ce genre de projets reflète assez bien certaines tendances concrètes du secteur). Je n’utilise plus X (Twitter), mais des personnes comme Simon Willison publient aussi parfois sur BlueSky et Mastodon. Sebastian Raschka, Chip Huyen et d’autres postent aussi sur LinkedIn. C’est dispersé un peu partout, mais au final on finit quand même par voir passer l’essentiel des nouvelles importantes
J’ai peut-être raté des choses importantes, mais les mises à jour vraiment centrales et significatives finissent naturellement par être mentionnées sur la page principale de HN ou dans les commentaires
Si l’on veut surtout suivre l’actualité des LLM et des modèles d’IA de pointe, la liste de recommandations est excellente ; plus de la moitié des personnes citées, je les avais aussi trouvées de mon côté
Je suis une liste de comptes IA sur X (Twitter), et globalement c’est la source d’information la plus robuste
Certains blogs et flux RSS de podcasts valent aussi le détour (et pour les chercheurs, les flux RSS d’articles sont indispensables)
J’ajouterais https://epoch.ai, le podcast de Dwarkesh Patel, le blog de Peter Wildeford, @omarsar0 (DAIR elvis), ainsi que le suivi direct de divers chercheurs (dont certains sont plus divertissants qu’informatifs)
L’environnement informationnel de ce domaine est gravement pollué. En particulier, si l’on suit seulement des médias comme le NYT, qui traitent surtout le sujet sous un angle politique, on finit au contraire avec une vision biaisée et inexacte
À noter que pour les domaines du ML non directement liés à l’IA générative (par exemple les protéines, la génomique, les modèles météo, ou la recherche sur la diffusion et la génération d’images), les sources d’information sont totalement différentes
La catégorie IA/ML est bien trop vaste pour tout suivre d’un seul bloc
Faut-il absolument suivre tout cela ? Non
Pour la plupart des gens, c’est surtout de la curiosité pour les nouvelles technologies et les tendances récentes
Cela dit, dans un domaine comme le développement logiciel, ignorer complètement l’IA pourrait devenir très problématique pour une carrière à moyen et long terme (même une approche centrée simplement sur l’apprentissage des outils peut suffire)
Pour ma part, comme mon travail m’oblige à garder une vision d’ensemble, je continue à suivre cela régulièrement
Le blog de Simon Willison suffit à lui seul pour apprendre des informations récentes de haute qualité (presque aucun bruit, excellent rapport signal/bruit)
Pas besoin de suivre à tout prix les « tendances »
Les métiers de la tech se raréfient, et finiront peut-être par diminuer brutalement un jour (si l’IA permet à une seule personne de faire le travail de dix, alors la même chose pourrait ensuite toucher les cols blancs, puis les cols bleus, comme avec les robots dans les entrepôts Amazon)
Personnellement, j’ai annulé mon abonnement GPT Plus cette semaine ; je n’ai plus envie de nourrir « ce monstre »
Pour des fonctions comme l’aide cartographique (itinéraires de voyage, circuits à vélo avec des amis, etc.), la version gratuite de Gemini fait même mieux
Suivre uniquement la première recommandation (lire le blog de simow) suffit largement dans la plupart des cas
Les cours d’Andrej Karpathy m’ont énormément aidé
Ils sont aussi disponibles sur YouTube (https://www.youtube.com/@AndrejKarpathy)
J’étais dans une position où j’aidais et mentorais des chercheurs en machine learning, mais quand j’écoute Andrej, j’ai l’impression d’être un étudiant qui ne connaît rien
Au début, c’était étrange, mais aujourd’hui je considère que cette humilité est en elle-même un atout très précieux
Cet état d’esprit de « je ne sais rien » est vraiment important
snif snif c’est vraiment illisible
Si vous trouvez ce niveau difficile à lire, le problème ne vient probablement pas du corps de l’article.
Je suis d’accord.
Un type d’écriture essentiel en ce moment.