87 points par GN⁺ 2025-07-21 | 5 commentaires | Partager sur WhatsApp
  • L’IA générative est la technologie qui évolue le plus vite, et il est dangereux à la fois de la sous-estimer et de la surestimer
  • Suivre régulièrement des sources faisant autorité et des experts fiables est indispensable
  • Recommandation d’un pipeline d’information équilibré, avec notamment Simon Willison’s Blog, Andrej Karpathy, Every’s Chain of Thought
  • Les annonces officielles des laboratoires d’IA, les blogs d’ingénierie et les articles de recherche sont essentiels pour comprendre les progrès réels de la technologie ainsi que ses limites
  • Grâce à des canaux variés comme Twitter/X, la curation d’actualités et des listes d’experts, on peut accéder à la fois aux dernières tendances et à des analyses approfondies

Introduction : malentendus autour de l’IA et pollution informationnelle

  • L’IA générative est, selon l’auteur, la technologie qui progresse le plus rapidement qu’il ait vue de sa vie
  • Mais les idées fausses sur l’IA sont elles aussi omniprésentes, et l’environnement informationnel lui-même est extrêmement confus
  • Il existe des cas bien réels où des entreprises, des gouvernements ou des individus qui ne comprennent pas suffisamment la technologie l’utilisent mal ou provoquent de graves dommages
  • On observe deux malentendus extrêmes : sous-estimer l’IA (« une mode passagère qui va bientôt disparaître ») ou la surestimer (« les programmeurs ne seront bientôt plus nécessaires »)
  • Le manque de bonne compréhension technique est à l’origine de ces contresens

Approche pour s’informer sur l’IA

  • Comprendre correctement les informations liées à l’IA est moins simple qu’on ne le pense
  • Nous évoluons dans un environnement où l’on est quotidiennement exposé à des informations déformées, exagérées ou à des discours étouffés
  • Sans tri intentionnel et méthodique, il est très facile de s’exposer aux erreurs, aux exagérations et aux distorsions
  • L’auteur explique qu’il s’appuie sur un pipeline d’information équilibré, qu’il recommande comme bon point de départ aux débutants

Principes généraux d’acquisition d’information

  • Il est important de s’appuyer sur des informations au plus près des sources primaires
    • Il faut vérifier les annonces officielles des laboratoires d’IA ou les prises de position des figures majeures comme sources de première main
    • Mieux vaut adopter une posture de méfiance vis-à-vis des reprises de seconde ou troisième main
  • Il faut aussi rechercher activement et consulter les commentaires d’experts fiables

Points de départ recommandés

  • Simon Willison’s Blog

  • Andrej Karpathy

    • Twitter/X | YouTube
    • Membre fondateur d’OpenAI et ancien directeur de l’IA chez Tesla
    • Une excellente source pour apprendre la structure interne et les principes des modèles d’IA de la façon la plus accessible, avec aussi des observations sur leur impact culturel et les changements sociaux qu’ils entraînent
    • Exemples : Deep Dive into LLMs like ChatGPT, How I Use LLMs

Every’s Chain of Thought

Comment suivre les publications officielles des laboratoires d’IA

Experts IA et ingénieurs terrain à suivre

  • Les informations partagées par des experts qui créent des outils open source et disposent d’une expérience concrète en ingénierie IA sont souvent plus utiles en pratique que les guides officiels

Figures et blogs particulièrement recommandés

Utiliser les actualités, médias et communautés IA

Communautés pour discussions et ressources approfondies sur l’IA

Méthodes pratiques pour s’informer

  • Il n’est pas nécessaire de suivre parfaitement toutes les sources : l’approche la plus praticable consiste à lire son fil Twitter comme un journal
  • Lorsqu’on découvre un texte intéressant, il est recommandé de suivre son auteur puis d’explorer aussi ses autres travaux
  • C’est une manière d’explorer l’information comparable à la découverte musicale d’autrefois
  • Si on l’aborde comme un plaisir intellectuel, cela peut devenir une joie plutôt qu’une obligation

Conclusion et liste recommandée

  • La liste Twitter/X fournie permet de suivre d’un seul coup les experts et praticiens mentionnés ci-dessus
  • Une version au format RSS devrait être ajoutée prochainement

Lien direct vers la liste Twitter

5 commentaires

 
GN⁺ 2025-07-21
Avis Hacker News
  • Je pense que si l’on comprend globalement comment fonctionnent les LLM, il n’est pas nécessaire de suivre en permanence tout le contenu produit par les RP, les blogueurs, les leaders du secteur et les penseurs d’Internet
    À force de suivre ces interviews ou ces articles, on risque surtout de courir après des modes étranges qui, en pratique, n’aident pas vraiment
    En réalité, les différences entre les modèles n’ont souvent été qu’une question de quelques années d’écart, sans divergence fondamentale majeure ; aujourd’hui, la plupart des changements se font au niveau des outils ou de l’intégration
    Il faut toujours garder en tête qu’un LLM reste au fond un « modèle de texte » généré sans connaissance sous-jacente ; cela permet de distinguer où il est utile et où il ne l’est pas

    • Je suis vraiment d’accord avec cet avis ; j’ai aussi eu l’impression que la liste « high signal » de ce blog était en fait surtout composée de figures d’auto-promotion (même s’il y a bien sûr quelques bonnes personnes), avec quelque chose de plus proche du buzz que du vrai recul
      Je ne partage pas non plus vraiment l’idée selon laquelle « l’IA a été la technologie qui a le plus progressé de toute ma vie »
      J’ai connu l’époque où les SVM montaient, où les réseaux neuronaux étaient traités comme une blague, puis l’explosion du deep learning et la multiplication rapide des frameworks DL sur une dizaine d’années
      Là aussi, il y a eu des avancées extrêmement rapides sur dix ans
      Sur le web, c’était comparable au passage de JS simple outil d’amélioration UX à la standardisation des applications monopage
      Le fond du sujet, c’est que si vous ne cherchez pas à figurer sur une « liste d’influenceurs clés », il vaut bien mieux avancer tranquillement et attendre le moment où cela devient réellement important pour vous
      Moi aussi, après l’époque de backbone.js, j’ai ignoré toutes les tendances du développement web pendant 10 ans, puis quand React est devenu nécessaire, quelques jours d’étude ont suffi pour m’y mettre immédiatement
      Il y a 5 ans, tout le monde voulait encore apprendre à implémenter des LSTM, alors qu’aujourd’hui c’est devenu dépassé à cause des transformers
      Ce que j’ai ressenti tout au long de ma carrière, c’est que « ça bouge vite » veut dire que ce n’est pas mûr
      Au contraire, apprendre les anciens modèles statistiques (GLM, etc.) et leurs usages encore réellement pratiques apporte souvent des solutions bien plus productives dans le travail quotidien que de courir après le « prompt hack » à la mode
    • Dès qu’on comprend à peu près l’architecture des LLM, la plupart des nouveautés sur les LLM tombent en gros dans deux catégories
      La première, ce sont de nouveaux outils un peu différents des précédents, ou avec des performances légèrement meilleures (s’ils apportent vraiment une fonction inédite, cela peut valoir le coup, mais la plupart deviennent vite obsolètes)
      Des noms comme Kimi-K2 ou GPT 4.1 peuvent très bien n’être plus mentionnés par personne dans quelques mois
      La seconde, ce sont les cas où de nouvelles capacités sont réellement ajoutées au modèle
      Par exemple : le RL (reinforcement learning), le chain of thought, les agents de code qui fonctionnent vraiment, les modèles multimodaux de très haut niveau, ou des intégrations d’outils intelligentes
      Il suffit de prêter attention quand ce type de grand saut se produit
      En pratique, parcourir les posts HN à plus de 500 points suffit déjà à capter naturellement les tendances récentes
      À mon avis, la meilleure façon d’apprendre les vraies capacités des LLM n’est ni les blogs ni les vidéos, mais l’expérience directe : construire des choses et se confronter au réel
    • Entièrement d’accord. C’est ce que je répète toujours à mes étudiants
      • 1. Ne vous absorbez pas excessivement dans l’expérience des autres ; concentrez-vous sur votre propre expérience directe
      • 2. Au lieu de lire des blogs, construisez vous-mêmes une application
      • 3. Les expériences de chacun diffèrent énormément, donc ne suivez pas telles quelles les idées des autres
      • 4. Ne suivez pas aveuglément les chercheurs ou développeurs sur Twitter ou Substack (la plupart font surtout leur propre vitrine)
      • 5. Ne perdez pas votre temps dans l’anxiété ou le FOMO ; apprenez en pratiquant. Les changements vraiment importants, vous finirez forcément par en entendre parler tôt ou tard
      • 6. Il est important d’être informé, mais il ne faut pas s’attacher de manière obsessionnelle à l’information elle-même. Répartissez votre temps intelligemment. J’insiste toujours sur ce point auprès des étudiants
    • En réalité, c’est pareil dans la recherche
      La recherche, à l’origine, c’est 99 % de progression incrémentale (et c’est une bonne chose ; il ne faut pas s’en décourager)
      La plupart des articles sont plus longs que nécessaire et, quand on les lit sérieusement, une bonne intuition mathématique permet souvent d’en anticiper une partie (si on comprend l’idée, on peut déjà pressentir les résultats)
      Il est facile d’avoir l’impression qu’un domaine change à toute vitesse, mais en pratique ce n’est pas si rapide que ça
      Moi aussi, quand je suis revenu après une année d’arrêt pour raisons personnelles, j’ai constaté qu’au fond, peu de choses avaient réellement changé
      Cette perspective permet de se libérer de la pression de « rester à niveau »
      Si c’est difficile en ce moment, cela veut surtout dire que votre expertise n’est pas encore assez solide, pas que vous êtes en retard
      De la même manière qu’il faut déjà savoir courir pour pouvoir suivre même avec un pas de retard, cette précipitation n’est souvent qu’une inquiétude dans notre propre tête
    • Quand j’explique les LLM, ce qui intéresse le plus les gens n’est pas tant l’architecture que l’idée de la « prédiction token par token (autorégression) » et le fait qu’on ne prend pas forcément le token le plus probable, mais qu’on échantillonne selon les probabilités
      L’algorithme central lui-même (la façon de prédire le token suivant) parle assez peu à la plupart des non-spécialistes
      Les détails comme le dot product ou les embeddings, personne ne s’en soucie vraiment. Même en les expliquant, cela reste difficile à retenir et pas si utile
  • Il n’est pas nécessaire de suivre absolument les « dernières tendances » ; je pense qu’il vaut mieux garder un intérêt détendu, tester sélectivement les fonctions et techniques qui peuvent réellement améliorer mon efficacité, et accumuler seulement ce qui m’est utile (je fais peu confiance au fait que quelqu’un ait recommandé telle ou telle chose sur X). Au contraire, j’ai beaucoup appris en écoutant des chercheurs plus critiques envers l’emballement autour de l’IA [https://x.com/burkov]. Il y a actuellement trop d’exagération, trop de changements et trop d’incertitude. Si une vraie innovation apparaît, on en entendra forcément parler sur HN (ou dans les grandes communautés généralistes)

    • Même y consacrer quelques heures directement vaut bien plus, en apprentissage, que de passer plusieurs heures à lire des ressources
  • J’ai trouvé que l’article expliquait mal le « pourquoi », ce qui rendait le « comment » de la liste moins convaincant. Mon temps précieux peut être utilisé ailleurs sans problème

    • Je me demande vraiment s’il faut « continuer à suivre » tout cela. Les innovations réellement significatives finissent de toute façon par se démocratiser et arriver naturellement jusqu’à moi. Par exemple, Excel ou Google Docs ne m’intéressaient pas particulièrement au début, et pourtant je les ai très bien adoptés une fois devenus grand public. Sauf cas où il y a une raison claire de courir, comme une startup IA dont la runway touche à sa fin, il n’y a pas lieu de paniquer
  • Je suis abonné à la newsletter « Pragmatic Engineer » de Gergely Orosz (qui parle beaucoup d’IA ces temps-ci), et je consulte aussi le Substack de Gary Marcus (avec un point de vue plus sceptique sur les LLM)
    https://newsletter.pragmaticengineer.com/
    https://substack.com/@garymarcus
    Je suis aussi automatiquement les actualités de packages Python comme Langchain ou PydanticAI (ce genre de projets reflète assez bien certaines tendances concrètes du secteur). Je n’utilise plus X (Twitter), mais des personnes comme Simon Willison publient aussi parfois sur BlueSky et Mastodon. Sebastian Raschka, Chip Huyen et d’autres postent aussi sur LinkedIn. C’est dispersé un peu partout, mais au final on finit quand même par voir passer l’essentiel des nouvelles importantes

  • J’ai peut-être raté des choses importantes, mais les mises à jour vraiment centrales et significatives finissent naturellement par être mentionnées sur la page principale de HN ou dans les commentaires

    • Essayer de suivre les tendances du secteur, c’est comme monter sur un tapis roulant qui tourne à 140 km/h. J’ai simplement renoncé à courir. Je suis d’accord sur le fait que l’IA (et surtout les LLM) n’est pas une mode passagère, mais en ce moment les changements sont trop violents. Je ne compte pas y investir beaucoup de temps tant que cela ne deviendra pas réellement nécessaire. D’ici quelques années, j’espère que le paysage du secteur sera plus clair. Et même si ce n’est pas le cas, au moins je n’aurai pas gaspillé mon temps sur des tendances appelées à devenir vite insignifiantes. Pour information, je n’utilise actuellement ni l’IA ni les LLM dans mon travail au quotidien
    • Vu les énormes investissements et efforts de R&D consentis par les entreprises, elles cherchent plutôt à exposer leur technologie qu’à la cacher (c’est presque l’inverse du secret)
    • J’aborde d’ailleurs de cette manière toutes les tendances du secteur IT
  • Si l’on veut surtout suivre l’actualité des LLM et des modèles d’IA de pointe, la liste de recommandations est excellente ; plus de la moitié des personnes citées, je les avais aussi trouvées de mon côté
    Je suis une liste de comptes IA sur X (Twitter), et globalement c’est la source d’information la plus robuste
    Certains blogs et flux RSS de podcasts valent aussi le détour (et pour les chercheurs, les flux RSS d’articles sont indispensables)
    J’ajouterais https://epoch.ai, le podcast de Dwarkesh Patel, le blog de Peter Wildeford, @omarsar0 (DAIR elvis), ainsi que le suivi direct de divers chercheurs (dont certains sont plus divertissants qu’informatifs)
    L’environnement informationnel de ce domaine est gravement pollué. En particulier, si l’on suit seulement des médias comme le NYT, qui traitent surtout le sujet sous un angle politique, on finit au contraire avec une vision biaisée et inexacte
    À noter que pour les domaines du ML non directement liés à l’IA générative (par exemple les protéines, la génomique, les modèles météo, ou la recherche sur la diffusion et la génération d’images), les sources d’information sont totalement différentes
    La catégorie IA/ML est bien trop vaste pour tout suivre d’un seul bloc
    Faut-il absolument suivre tout cela ? Non
    Pour la plupart des gens, c’est surtout de la curiosité pour les nouvelles technologies et les tendances récentes
    Cela dit, dans un domaine comme le développement logiciel, ignorer complètement l’IA pourrait devenir très problématique pour une carrière à moyen et long terme (même une approche centrée simplement sur l’apprentissage des outils peut suffire)
    Pour ma part, comme mon travail m’oblige à garder une vision d’ensemble, je continue à suivre cela régulièrement

  • Le blog de Simon Willison suffit à lui seul pour apprendre des informations récentes de haute qualité (presque aucun bruit, excellent rapport signal/bruit)

    • En soutenant Simon sur GitHub (10 $ ou plus), on peut recevoir par e-mail « moins de contenu, mais les résumés essentiels »

      « Résumé des évolutions les plus importantes du domaine des LLM au cours du mois écoulé (lecture en moins de 10 minutes) »
      https://simonwillison.net/about/

    • https://simonwillison.net
    • Heureusement, il propose aussi un flux RSS, ce qui permet de suivre à la fois le code et l’actualité
  • Pas besoin de suivre à tout prix les « tendances »

    • Oui, c’est peut-être le moment d’arrêter et de faire autre chose
    • En réalité, quitter complètement la tech pour construire une nouvelle carrière est aussi une option
      Les métiers de la tech se raréfient, et finiront peut-être par diminuer brutalement un jour (si l’IA permet à une seule personne de faire le travail de dix, alors la même chose pourrait ensuite toucher les cols blancs, puis les cols bleus, comme avec les robots dans les entrepôts Amazon)
      Personnellement, j’ai annulé mon abonnement GPT Plus cette semaine ; je n’ai plus envie de nourrir « ce monstre »
      Pour des fonctions comme l’aide cartographique (itinéraires de voyage, circuits à vélo avec des amis, etc.), la version gratuite de Gemini fait même mieux
  • Suivre uniquement la première recommandation (lire le blog de simow) suffit largement dans la plupart des cas

    • Même cela me demande trop d’effort, donc je remplace ça par les vidéos de Fireship avec mon café du matin
    • Je recommande vivement : très bons résumés, avec très peu de clickbait
  • Les cours d’Andrej Karpathy m’ont énormément aidé
    Ils sont aussi disponibles sur YouTube (https://www.youtube.com/@AndrejKarpathy)
    J’étais dans une position où j’aidais et mentorais des chercheurs en machine learning, mais quand j’écoute Andrej, j’ai l’impression d’être un étudiant qui ne connaît rien
    Au début, c’était étrange, mais aujourd’hui je considère que cette humilité est en elle-même un atout très précieux
    Cet état d’esprit de « je ne sais rien » est vraiment important

 
makers 2025-07-22

snif snif c’est vraiment illisible

 
reagea0 2025-07-23

Si vous trouvez ce niveau difficile à lire, le problème ne vient probablement pas du corps de l’article.

 
harris 2025-07-28

Je suis d’accord.

 
supermaxi 2025-07-22

Un type d’écriture essentiel en ce moment.