Des graphiques pour expliquer l’état de l’IA en 2026
(spectrum.ieee.org)- AI Index 2026 est un rapport qui agrège les grandes tendances de l’IA à travers des indicateurs comme les performances sur benchmark, les investissements, la perception du public, le compute et les émissions carbone
- Les lancements de modèles d’IA notables ont continué à être dominés par les États-Unis et l’industrie, tandis que la Chine a conservé une nette avance sur les installations de robots industriels
- La capacité mondiale de compute IA a plus que triplé chaque année depuis 2022, et les GPU Nvidia représentent désormais plus de 60 % de la capacité totale
- Les performances sur benchmark des LLM multimodaux et de l’agentic AI ont rapidement progressé, mais la précision reste faible sur des tâches générales comme la lecture d’horloges analogiques
- En 2025, les investissements dans l’IA ont dépassé 581 milliards de dollars pour atteindre un record historique, tandis que l’impact sur l’emploi, la confiance dans la régulation et l’acceptation par le public varient fortement selon les pays et les indicateurs
Indicateurs clés du rapport AI Index 2026
- Le rapport AI Index 2026 de Stanford, long de plus de 400 pages, dresse un état des lieux de l’IA sous plusieurs angles, notamment les scores sur benchmark, les investissements et la perception du public
- Les performances des modèles d’IA de pointe continuent de s’accélérer, et de grandes entreprises de l’IA comme OpenAI et Anthropic avancent vers une IPO plus tard dans l’année
- Le rejet de l’IA persiste aussi, en particulier aux États-Unis, où des collectivités locales commencent à adopter des restrictions, voire des interdictions totales, sur le développement de nouveaux data centers
- Dans la continuité des couvertures des années précédentes de 2021 à 2025, sélection de tendances qui condensent l’état de l’IA en 2026
La domination américaine sur les modèles d’IA
- Les États-Unis ont dominé les lancements de modèles d’IA notables au cours des dix dernières années, et cette tendance s’est maintenue en 2025
- Selon Epoch AI, les organisations basées aux États-Unis ont lancé 50 modèles notables en 2025
- La production chinoise commence à réduire l’écart
- La quasi-totalité des modèles notables proviennent de l’industrie
- En 2025, l’industrie a lancé 87 modèles notables
- Les autres sources réunies, y compris le monde académique et les agences gouvernementales, n’en ont lancé que 7
- La part de l’industrie a fortement augmenté sur le long terme
- Les modèles lancés par l’industrie représentent aujourd’hui plus de 90 % des modèles notables
- C’était moins de 50 % en 2015, et 0 en 2003
L’avance de la Chine dans le déploiement de la robotique
- Si les entreprises américaines dominent en nombre de modèles d’IA notables, la Chine dispose d’une avance nette dans le déploiement de la robotique
- D’après les données de l’International Federation of Robotics, le nombre d’installations de robots industriels en Chine a atteint 295�0 en 2024
- Le Japon en a installé environ 4400, et les États-Unis 3400
Forte hausse du compute IA mondial
- L’indicateur de capacité totale de compute IA d’Epoch AI est présenté comme une mesure représentative de l’expansion de l’infrastructure IA
- Sur un graphique prenant comme référence la performance du H100e de Nvidia, la capacité mondiale de compute IA a plus que triplé chaque année depuis 2022
- En prenant 2021 comme première année de suivi, le compute IA total a été multiplié par 30
- Nvidia est le principal bénéficiaire de cette expansion
- Les GPU Nvidia représentent aujourd’hui plus de 60 % de la capacité mondiale totale de compute IA
- Amazon et Google, qui conçoivent leur propre matériel IA, suivent derrière
Émissions carbone de l’entraînement et de l’inférence IA
- Les émissions carbone liées à l’entraînement de l’IA faisaient déjà partie des points soulevés les années précédentes, et les inquiétudes persistent en 2026
- L’entraînement des derniers grands modèles de langage de frontière est estimé à des niveaux d’émissions très élevés
- Les émissions estimées pour l’entraînement de Grok 4 de xAI dépassent 72�00 tonnes en équivalent carbone
- GPT-4 d’OpenAI est estimé à 584 tonnes, et Llama 3.1 405B de Meta à 8 30 tonnes
- Ray Perrault précise qu’il s’agit d’estimations et appelle à la prudence dans leur interprétation
- “These estimates should be interpreted with caution”
- Dans le cas de Grok, il existe une incertitude importante, car les hypothèses d’entrée reposent largement sur un article de Forbes, des déclarations de xAI et d’autres sources impossibles à vérifier
- Epoch AI estime indépendamment les émissions de Grok 4 à un niveau plus élevé, d’environ 140�00 tonnes de CO₂
- Les émissions d’inférence de l’IA augmentent aussi, avec de fortes différences selon les modèles
- Les modèles d’inférence les moins efficaces émettent plus de 10 fois plus que les plus efficaces
- DeepSeek V3 est estimé à environ 23 watts pour répondre à un prompt de longueur moyenne
- Claude 4 Opus est estimé à environ 5 watts
Accélération des performances sur benchmark des LLM
- Au cours des dix dernières années, les performances des modèles d’IA se sont améliorées très rapidement, et les graphiques montrent même une accélération de ce rythme
- Les LLM multimodaux en particulier progressent au point de conquérir presque immédiatement les nouveaux benchmarks à mesure qu’ils apparaissent
- C’est dans le domaine de l’agentic AI que la progression est la plus spectaculaire
- Les deux lignes à très forte pente à droite du graphique correspondent au benchmark OSWorld, qui évalue l’usage autonome d’un ordinateur
- Et au benchmark d’ingénierie logicielle SWE-Bench Verified, qui évalue le code autonome
- Les performances progressent aussi rapidement sur Humanity’s Last Exam
- Dans le Stanford AI Index 2025, le taux de bonnes réponses du modèle classé n°1, o1 d’OpenAI, était de 8,8 %
- Depuis, la précision est montée à 38,3 %
- En avril 2026, les meilleurs scores, obtenus notamment par Claude Opus 4.6 d’Anthropic et Gemini 3.1 Pro de Google, dépassent 50 %
- Ray Perrault attire l’attention sur la correspondance entre benchmarks et performances réelles
- “We generally lack measures of how well a system (or agent) needs to function in a particular setting”
- Il note qu’un taux de 75 % sur un benchmark de raisonnement juridique ne permet pas, à lui seul, de savoir si le modèle est adapté au travail réel d’un cabinet d’avocats
Expansion de la recherche IA dans la santé
- L’adoption de l’IA dans la recherche médicale augmente rapidement
- Le nombre d’articles sur la découverte de médicaments fondée sur l’IA a plus que doublé au cours des deux dernières années
- Le nombre d’articles sur l’IA biomédicale multimodale, qui traite à la fois des images médicales et du texte, a été multiplié par 2,7 par rapport à il y a deux ans
Les limites de la lecture d’horloges analogiques
- Malgré des progrès rapides dans certains domaines, des faiblesses persistent sur des tâches générales comme la lecture d’horloges analogiques et la compréhension des calendriers
- Dans ClockBench, qui mesure la capacité des LLM multimodaux à lire une horloge analogique, même le meilleur modèle n’atteint qu’environ une chance sur deux de réussir
- La probabilité de bonne réponse de GPT-5.4 d’OpenAI est de 50-50
- La plupart des modèles obtiennent des résultats bien inférieurs
- La précision de Claude Opus 4.6 d’Anthropic n’est que de 8,9 %
- Il est également mentionné que ce même modèle obtient pourtant l’un des meilleurs scores sur Humanity’s Last Exam
- Ray Perrault relie cela à un problème plus général
- Lorsqu’on demande une combinaison du langage avec d’autres modalités, comme l’image ou le ton de la voix, la composante linguistique pèse davantage que prévu
- Il cite aussi des travaux suggérant que cela peut aller jusqu’à ignorer complètement l’information non linguistique
Record des investissements IA en 2025
- Avec l’amélioration des performances des modèles, les investissements dans l’IA ont eux aussi fortement progressé
- Selon les données de l’entreprise d’analyse IA Quid, les investissements dans l’IA ont battu un record en 2025 avec plus de 581 milliards de dollars
- Soit plus du double des 253 milliards de dollars de 2024
- Et largement au-dessus du précédent record de 360 milliards de dollars en 2021
- Contrairement à 2021, le record de 2025 a été porté non par les fusions-acquisitions, mais par les investissements privés dans les entreprises d’IA
- L’essentiel des capitaux s’est dirigé vers les États-Unis
- L’an dernier, les investissements IA aux États-Unis ont dépassé 344 milliards de dollars
Les ingénieurs logiciel focalisés sur l’IA
- Sur GitHub, le nombre de projets liés à l’IA a bondi à 5,58 millions en 2025
- Soit environ 5 fois plus qu’en 2020
- Et une hausse de 23,7 % par rapport à 2024
- Cette hausse ne semble pas s’expliquer uniquement par une prolifération de projets générés par l’IA
- Le nombre de projets avec au moins 10 étoiles a augmenté à un rythme similaire
- Le nombre total de stars reçues par les projets IA a lui aussi augmenté à un rythme comparable
- Ce qui suggère une participation humaine réelle
- Exemple phare cité : le logiciel open source d’agentic AI OpenClaw
- Il a obtenu 352�00 stars sur GitHub
- Ray Perrault reconnaît que les bots ou agents IA peuvent contribuer en partie à cette effervescence
- “probably the intensity of GitHub use is highly correlated with the intensity of AI use”
- Il ajoute qu’en se fondant sur le site de suivi d’activité Agents in the Wild, non mentionné dans le rapport de Stanford, une grande partie de l’activité GitHub semble encore être réalisée par des humains
- L’engouement pour l’IA reste aussi fort dans les articles en informatique
- Le nombre d’articles d’informatique liés à l’IA est passé de 102�0 à 258�0 en dix ans, soit plus du double
- En 2024, plus de 68 % d’entre eux provenaient du monde académique
- Le gouvernement et l’industrie représentaient respectivement environ 11,5 % et 12,5 %
- La croissance a été tirée par le machine learning, la computer vision et l’IA générative
Incertitude sur l’impact de l’IA sur l’emploi
- Avec la diffusion de l’IA générative, les inquiétudes sur l’emploi se sont renforcées, mais les données actuelles donnent des résultats contrastés
- Le rapport présente des graphiques du nombre normalisé de personnes par tranche d’âge dans des métiers considérés comme très exposés au remplacement par l’IA, notamment les software developers et les customer support agents
- Les postes juniors reculent
- Les postes intermédiaires et seniors se maintiennent ou progressent
- Il reste difficile d’interpréter ces évolutions indépendamment des dynamiques économiques plus larges
- Le rapport mentionne une hausse du chômage dans de nombreux métiers
- Contrairement à ce qu’on pouvait attendre, la hausse du chômage a été plus forte chez les travailleurs les moins exposés à l’IA que chez ceux qui y sont le plus exposés
Évolution de la perception du public vis-à-vis de l’IA
- Dans l’enquête Ipsos, l’optimisme vis-à-vis de l’IA a légèrement mais nettement progressé ces dernières années
- La part des répondants estimant que “benefits outweigh the drawbacks” est passée de 55 % en 2024 à 59 %
- La part déclarant avoir une “good understanding” de l’IA est passée légèrement de 67 % à 68 %
- Sur des questions similaires, l’acceptation globale reste plus positive que négative, mais certains sentiments négatifs progressent aussi
- 52 % des répondants disent que les produits et services utilisant l’IA les rendent “nervous”
- Les écarts entre pays sont importants
- La Chine et des pays d’Asie du Sud-Est comme la Malaysia, la Thailand, l’Indonesia et Singapore se montrent plus positifs
- Les plus fortes évolutions positives sur un an sont observées en Germany +12 %, France +10 % et the Netherlands +10 %
- La Colombia enregistre la plus forte dégradation avec -6 %
Différences entre pays dans la confiance envers la régulation de l’IA
- À mesure que progresse l’idée que l’IA pourrait avoir un impact positif, une profonde défiance envers la régulation publique apparaît aussi dans certains pays
- Les États-Unis, en particulier, figurent parmi les derniers en matière de confiance dans la régulation, malgré leur rôle de leader dans l’investissement IA
- Dans l’enquête Ipsos, seuls 31 % des répondants américains disent faire confiance à la régulation gouvernementale de l’IA
- De nombreux pays européens ainsi que le Japon affichent eux aussi un faible niveau de confiance
- Les pays d’Asie et d’Amérique du Sud sont ceux qui font le plus confiance à la capacité de leur gouvernement à réguler l’IA
- Le contraste entre les États-Unis et la Colombia est particulièrement marqué
- Aux États-Unis, la défiance envers la régulation de l’IA est profonde, mais une majorité de répondants estime malgré tout que les bénéfices de l’IA l’emporteront sur ses inconvénients
- En Colombia, la confiance dans la régulation de l’IA est élevée, mais le sentiment général vis-à-vis de l’IA se dégrade
- Comme un condensé du récit de l’IA en 2025, la qualité des performances des modèles et la perception de leurs effets sociaux varient fortement selon les tâches et les questions posées
1 commentaires
Commentaires sur Hacker News
Je voudrais souligner que la perception de l’IA chez les jeunes n’est pas aussi positive qu’on pourrait le croire. Si l’on regarde l’enquête Gallup, le scepticisme semble assez net
Même si l’entraînement d’un LLM frontier récent émet plus de 72�0 tonnes de carbone, cela reste relativement faible comparé aux 38 milliards de tonnes émises chaque année dans le monde
Au final, je pense que personne n’aura vraiment de moat, donc ces graphiques me donnent surtout l’impression d’amplifier les illusions des investisseurs
Le leadership de la Chine en robotique saute aux yeux, mais ce qui m’a frappé en premier, c’est surtout le graphique des émissions de Grok
Dire que « les ingénieurs logiciels se sont rués sur l’IA » simplement parce que le nombre de projets GitHub créés augmente, ça me paraît assez ridicule. Créer un dépôt ne fait pas automatiquement de quelqu’un un ingénieur logiciel ; si c’était le cas, on n’aurait même pas eu besoin d’étudier autre chose
La partie disant que « la Chine est en avance en robotique » ne semble pas avoir grand-chose à voir avec l’IA. Le graphique sur la Chine suit à peu près la même trajectoire depuis 2012, donc j’ai l’impression qu’il colle mal au contexte de l’article
Dire que « l’entraînement des modèles d’IA peut émettre énormément de carbone » est juste, mais ce que j’aimerais vraiment voir, c’est un graphique montrant combien de carbone est émis au niveau mondial pour faire tourner ces modèles en production
J’ai du mal à être d’accord avec la phrase disant que « les performances des modèles d’IA se sont améliorées à une vitesse remarquable au cours des 10 dernières années, et que ces progrès s’accélèrent ». À mes yeux, presque tous les domaines sont déjà en train d’entrer dans une phase de plateau. Certains domaines plus récents, comme les mathématiques de compétition, semblent encore moins touchés, mais au vu des tendances passées, il y a de fortes chances qu’ils finissent eux aussi par plafonner de façon similaire
Je ne comprends toujours pas très bien l’expression State of AI in 2026
Cet article semble être un doublon. Le message original est dans ce fil, et la source est le 2026 AI Index Report de Stanford HAI