Des graphiques pour expliquer l’état de l’IA en 2026

(spectrum.ieee.org)

3 points par GN⁺ 10 일 전 | 1 commentaires | Partager sur WhatsApp

AI Index 2026 est un rapport qui agrège les grandes tendances de l’IA à travers des indicateurs comme les performances sur benchmark, les investissements, la perception du public, le compute et les émissions carbone
Les lancements de modèles d’IA notables ont continué à être dominés par les États-Unis et l’industrie, tandis que la Chine a conservé une nette avance sur les installations de robots industriels
La capacité mondiale de compute IA a plus que triplé chaque année depuis 2022, et les GPU Nvidia représentent désormais plus de 60 % de la capacité totale
Les performances sur benchmark des LLM multimodaux et de l’agentic AI ont rapidement progressé, mais la précision reste faible sur des tâches générales comme la lecture d’horloges analogiques
En 2025, les investissements dans l’IA ont dépassé 581 milliards de dollars pour atteindre un record historique, tandis que l’impact sur l’emploi, la confiance dans la régulation et l’acceptation par le public varient fortement selon les pays et les indicateurs

Indicateurs clés du rapport AI Index 2026

Le rapport AI Index 2026 de Stanford, long de plus de 400 pages, dresse un état des lieux de l’IA sous plusieurs angles, notamment les scores sur benchmark, les investissements et la perception du public
Les performances des modèles d’IA de pointe continuent de s’accélérer, et de grandes entreprises de l’IA comme OpenAI et Anthropic avancent vers une IPO plus tard dans l’année
Le rejet de l’IA persiste aussi, en particulier aux États-Unis, où des collectivités locales commencent à adopter des restrictions, voire des interdictions totales, sur le développement de nouveaux data centers
Dans la continuité des couvertures des années précédentes de 2021 à 2025, sélection de tendances qui condensent l’état de l’IA en 2026

La domination américaine sur les modèles d’IA

Les États-Unis ont dominé les lancements de modèles d’IA notables au cours des dix dernières années, et cette tendance s’est maintenue en 2025
- Selon Epoch AI, les organisations basées aux États-Unis ont lancé 50 modèles notables en 2025
- La production chinoise commence à réduire l’écart
La quasi-totalité des modèles notables proviennent de l’industrie
- En 2025, l’industrie a lancé 87 modèles notables
- Les autres sources réunies, y compris le monde académique et les agences gouvernementales, n’en ont lancé que 7
La part de l’industrie a fortement augmenté sur le long terme
- Les modèles lancés par l’industrie représentent aujourd’hui plus de 90 % des modèles notables
- C’était moins de 50 % en 2015, et 0 en 2003

L’avance de la Chine dans le déploiement de la robotique

Si les entreprises américaines dominent en nombre de modèles d’IA notables, la Chine dispose d’une avance nette dans le déploiement de la robotique
- D’après les données de l’International Federation of Robotics, le nombre d’installations de robots industriels en Chine a atteint 295�0 en 2024
- Le Japon en a installé environ 4400, et les États-Unis 3400

Forte hausse du compute IA mondial

L’indicateur de capacité totale de compute IA d’Epoch AI est présenté comme une mesure représentative de l’expansion de l’infrastructure IA
Sur un graphique prenant comme référence la performance du H100e de Nvidia, la capacité mondiale de compute IA a plus que triplé chaque année depuis 2022
- En prenant 2021 comme première année de suivi, le compute IA total a été multiplié par 30
Nvidia est le principal bénéficiaire de cette expansion
- Les GPU Nvidia représentent aujourd’hui plus de 60 % de la capacité mondiale totale de compute IA
- Amazon et Google, qui conçoivent leur propre matériel IA, suivent derrière

Émissions carbone de l’entraînement et de l’inférence IA

Les émissions carbone liées à l’entraînement de l’IA faisaient déjà partie des points soulevés les années précédentes, et les inquiétudes persistent en 2026
L’entraînement des derniers grands modèles de langage de frontière est estimé à des niveaux d’émissions très élevés
- Les émissions estimées pour l’entraînement de Grok 4 de xAI dépassent 72�00 tonnes en équivalent carbone
- GPT-4 d’OpenAI est estimé à 584 tonnes, et Llama 3.1 405B de Meta à 8 30 tonnes
Ray Perrault précise qu’il s’agit d’estimations et appelle à la prudence dans leur interprétation
- “These estimates should be interpreted with caution”
- Dans le cas de Grok, il existe une incertitude importante, car les hypothèses d’entrée reposent largement sur un article de Forbes, des déclarations de xAI et d’autres sources impossibles à vérifier
- Epoch AI estime indépendamment les émissions de Grok 4 à un niveau plus élevé, d’environ 140�00 tonnes de CO₂
Les émissions d’inférence de l’IA augmentent aussi, avec de fortes différences selon les modèles
- Les modèles d’inférence les moins efficaces émettent plus de 10 fois plus que les plus efficaces
- DeepSeek V3 est estimé à environ 23 watts pour répondre à un prompt de longueur moyenne
- Claude 4 Opus est estimé à environ 5 watts

Accélération des performances sur benchmark des LLM

Au cours des dix dernières années, les performances des modèles d’IA se sont améliorées très rapidement, et les graphiques montrent même une accélération de ce rythme
Les LLM multimodaux en particulier progressent au point de conquérir presque immédiatement les nouveaux benchmarks à mesure qu’ils apparaissent
C’est dans le domaine de l’agentic AI que la progression est la plus spectaculaire
- Les deux lignes à très forte pente à droite du graphique correspondent au benchmark OSWorld, qui évalue l’usage autonome d’un ordinateur
- Et au benchmark d’ingénierie logicielle SWE-Bench Verified, qui évalue le code autonome
Les performances progressent aussi rapidement sur Humanity’s Last Exam
- Dans le Stanford AI Index 2025, le taux de bonnes réponses du modèle classé n°1, o1 d’OpenAI, était de 8,8 %
- Depuis, la précision est montée à 38,3 %
- En avril 2026, les meilleurs scores, obtenus notamment par Claude Opus 4.6 d’Anthropic et Gemini 3.1 Pro de Google, dépassent 50 %
Ray Perrault attire l’attention sur la correspondance entre benchmarks et performances réelles
- “We generally lack measures of how well a system (or agent) needs to function in a particular setting”
- Il note qu’un taux de 75 % sur un benchmark de raisonnement juridique ne permet pas, à lui seul, de savoir si le modèle est adapté au travail réel d’un cabinet d’avocats

Expansion de la recherche IA dans la santé

L’adoption de l’IA dans la recherche médicale augmente rapidement
Le nombre d’articles sur la découverte de médicaments fondée sur l’IA a plus que doublé au cours des deux dernières années
Le nombre d’articles sur l’IA biomédicale multimodale, qui traite à la fois des images médicales et du texte, a été multiplié par 2,7 par rapport à il y a deux ans

Les limites de la lecture d’horloges analogiques

Malgré des progrès rapides dans certains domaines, des faiblesses persistent sur des tâches générales comme la lecture d’horloges analogiques et la compréhension des calendriers
Dans ClockBench, qui mesure la capacité des LLM multimodaux à lire une horloge analogique, même le meilleur modèle n’atteint qu’environ une chance sur deux de réussir
- La probabilité de bonne réponse de GPT-5.4 d’OpenAI est de 50-50
La plupart des modèles obtiennent des résultats bien inférieurs
- La précision de Claude Opus 4.6 d’Anthropic n’est que de 8,9 %
- Il est également mentionné que ce même modèle obtient pourtant l’un des meilleurs scores sur Humanity’s Last Exam
Ray Perrault relie cela à un problème plus général
- Lorsqu’on demande une combinaison du langage avec d’autres modalités, comme l’image ou le ton de la voix, la composante linguistique pèse davantage que prévu
- Il cite aussi des travaux suggérant que cela peut aller jusqu’à ignorer complètement l’information non linguistique

Record des investissements IA en 2025

Avec l’amélioration des performances des modèles, les investissements dans l’IA ont eux aussi fortement progressé
Selon les données de l’entreprise d’analyse IA Quid, les investissements dans l’IA ont battu un record en 2025 avec plus de 581 milliards de dollars
- Soit plus du double des 253 milliards de dollars de 2024
- Et largement au-dessus du précédent record de 360 milliards de dollars en 2021
Contrairement à 2021, le record de 2025 a été porté non par les fusions-acquisitions, mais par les investissements privés dans les entreprises d’IA
L’essentiel des capitaux s’est dirigé vers les États-Unis
- L’an dernier, les investissements IA aux États-Unis ont dépassé 344 milliards de dollars

Les ingénieurs logiciel focalisés sur l’IA

Sur GitHub, le nombre de projets liés à l’IA a bondi à 5,58 millions en 2025
- Soit environ 5 fois plus qu’en 2020
- Et une hausse de 23,7 % par rapport à 2024
Cette hausse ne semble pas s’expliquer uniquement par une prolifération de projets générés par l’IA
- Le nombre de projets avec au moins 10 étoiles a augmenté à un rythme similaire
- Le nombre total de stars reçues par les projets IA a lui aussi augmenté à un rythme comparable
- Ce qui suggère une participation humaine réelle
Exemple phare cité : le logiciel open source d’agentic AI OpenClaw
- Il a obtenu 352�00 stars sur GitHub
Ray Perrault reconnaît que les bots ou agents IA peuvent contribuer en partie à cette effervescence
- “probably the intensity of GitHub use is highly correlated with the intensity of AI use”
- Il ajoute qu’en se fondant sur le site de suivi d’activité Agents in the Wild, non mentionné dans le rapport de Stanford, une grande partie de l’activité GitHub semble encore être réalisée par des humains
L’engouement pour l’IA reste aussi fort dans les articles en informatique
- Le nombre d’articles d’informatique liés à l’IA est passé de 102�0 à 258�0 en dix ans, soit plus du double
- En 2024, plus de 68 % d’entre eux provenaient du monde académique
- Le gouvernement et l’industrie représentaient respectivement environ 11,5 % et 12,5 %
- La croissance a été tirée par le machine learning, la computer vision et l’IA générative

Incertitude sur l’impact de l’IA sur l’emploi

Avec la diffusion de l’IA générative, les inquiétudes sur l’emploi se sont renforcées, mais les données actuelles donnent des résultats contrastés
Le rapport présente des graphiques du nombre normalisé de personnes par tranche d’âge dans des métiers considérés comme très exposés au remplacement par l’IA, notamment les software developers et les customer support agents
- Les postes juniors reculent
- Les postes intermédiaires et seniors se maintiennent ou progressent
Il reste difficile d’interpréter ces évolutions indépendamment des dynamiques économiques plus larges
- Le rapport mentionne une hausse du chômage dans de nombreux métiers
- Contrairement à ce qu’on pouvait attendre, la hausse du chômage a été plus forte chez les travailleurs les moins exposés à l’IA que chez ceux qui y sont le plus exposés

Évolution de la perception du public vis-à-vis de l’IA

Dans l’enquête Ipsos, l’optimisme vis-à-vis de l’IA a légèrement mais nettement progressé ces dernières années
- La part des répondants estimant que “benefits outweigh the drawbacks” est passée de 55 % en 2024 à 59 %
- La part déclarant avoir une “good understanding” de l’IA est passée légèrement de 67 % à 68 %
Sur des questions similaires, l’acceptation globale reste plus positive que négative, mais certains sentiments négatifs progressent aussi
- 52 % des répondants disent que les produits et services utilisant l’IA les rendent “nervous”
Les écarts entre pays sont importants
- La Chine et des pays d’Asie du Sud-Est comme la Malaysia, la Thailand, l’Indonesia et Singapore se montrent plus positifs
- Les plus fortes évolutions positives sur un an sont observées en Germany +12 %, France +10 % et the Netherlands +10 %
- La Colombia enregistre la plus forte dégradation avec -6 %

Différences entre pays dans la confiance envers la régulation de l’IA

À mesure que progresse l’idée que l’IA pourrait avoir un impact positif, une profonde défiance envers la régulation publique apparaît aussi dans certains pays
Les États-Unis, en particulier, figurent parmi les derniers en matière de confiance dans la régulation, malgré leur rôle de leader dans l’investissement IA
- Dans l’enquête Ipsos, seuls 31 % des répondants américains disent faire confiance à la régulation gouvernementale de l’IA
De nombreux pays européens ainsi que le Japon affichent eux aussi un faible niveau de confiance
Les pays d’Asie et d’Amérique du Sud sont ceux qui font le plus confiance à la capacité de leur gouvernement à réguler l’IA
Le contraste entre les États-Unis et la Colombia est particulièrement marqué
- Aux États-Unis, la défiance envers la régulation de l’IA est profonde, mais une majorité de répondants estime malgré tout que les bénéfices de l’IA l’emporteront sur ses inconvénients
- En Colombia, la confiance dans la régulation de l’IA est élevée, mais le sentiment général vis-à-vis de l’IA se dégrade
Comme un condensé du récit de l’IA en 2025, la qualité des performances des modèles et la perception de leurs effets sociaux varient fortement selon les tâches et les questions posées

1 commentaires

GN⁺ 10 일 전

Commentaires sur Hacker News

Je voudrais souligner que la perception de l’IA chez les jeunes n’est pas aussi positive qu’on pourrait le croire. Si l’on regarde l’enquête Gallup, le scepticisme semble assez net
- J’y vois un processus par lequel on découvre peu à peu les limites intrinsèques de l’IA
- Je pense que cette ambiance est temporaire. Comme à chaque grande transition technologique dans l’histoire, tout le monde finira par s’adapter et par trouver des usages pertinents
Même si l’entraînement d’un LLM frontier récent émet plus de 72�0 tonnes de carbone, cela reste relativement faible comparé aux 38 milliards de tonnes émises chaque année dans le monde
- Je ne pense pas du tout que le fait que les émissions d’entraînement d’un seul LLM correspondent aux émissions annuelles de 17�00 personnes soit anodin. D’après l’article, c’est une hausse de 8 fois par rapport à l’an dernier, et il est possible que ce soit sous-estimé d’environ un facteur 2. En plus, cela n’inclut ni le hardware, ni les bots de collecte de données d’entraînement, ni le traitement des prompts, donc pas l’ensemble de l’usage. Et il existe plusieurs modèles géants, ainsi que des dizaines de milliers de petits modèles. L’estimation selon laquelle les émissions totales de l’IA dépasseraient 80 millions de tonnes de CO2e cette année est supérieure aux émissions d’un pays entier comme l’Autriche ou Israël, donc ce n’est certainement pas négligeable
- On peut aussi le voir autrement. Si l’entraînement d’un modèle coûte 72�0 tonnes et que 100 millions de personnes l’utilisent, cela représente 0,00072 tonne par personne. Selon l’article, l’être humain moyen émet plus de 5 tonnes par an, et un Américain autour de 18 tonnes, donc ajouter 0,00072 ne change pratiquement rien à l’échelle individuelle. Bien sûr, le coût de l’inférence est à part
- Même en tenant compte du fait que xAI semble avoir délibérément augmenté son intensité carbone, je trouve ce chiffre en pratique minime. Et puis, choisir deux grands modèles de 2025 et prendre Grok dans les deux cas, c’est un peu risible : on a l’impression qu’ils ont retenu l’un des modèles les moins utiles, les moins utilisés et les moins intéressants de l’année
Au final, je pense que personne n’aura vraiment de moat, donc ces graphiques me donnent surtout l’impression d’amplifier les illusions des investisseurs
- Je pense au contraire qu’un moat va clairement se former. On peut concentrer son budget sur la qualité des tokens, ou utiliser moins de tokens mais de meilleure qualité. Si on ajoute à cela une base d’utilisateurs et de l’engagement, on obtient un flywheel difficile à rattraper pour les nouveaux entrants. Le marché est complexe, et trop simplifier fait passer à côté de beaucoup de choses
- Pour moi, le capital et le momentum sont eux aussi un moat. Les modèles chinois utilisent bien la distillation, mais on ne les a pas encore beaucoup vus entraîner de très grands modèles depuis zéro. Cela dit, la situation pourrait changer si les puces deviennent moins chères et si les puces chinoises montent vraiment en puissance
Le leadership de la Chine en robotique saute aux yeux, mais ce qui m’a frappé en premier, c’est surtout le graphique des émissions de Grok
- Quand je lis dans l’article que « cette estimation doit être interprétée avec prudence et, dans le cas de Grok, repose fortement sur des valeurs d’entrée déduites de rapports publics », je trouve ce graphique un peu douteux sur le plan de la fiabilité
Dire que « les ingénieurs logiciels se sont rués sur l’IA » simplement parce que le nombre de projets GitHub créés augmente, ça me paraît assez ridicule. Créer un dépôt ne fait pas automatiquement de quelqu’un un ingénieur logiciel ; si c’était le cas, on n’aurait même pas eu besoin d’étudier autre chose
- Je suis d’accord pour dire que cet indicateur n’est pas bon, et je pense qu’il vaudrait mieux le remplacer par un indicateur comme Claude Code GitHub Commits Over Time. Ce n’est pas parfait non plus, bien sûr, mais c’est au moins un indicateur un peu moins imparfait, et j’ai l’impression qu’il montre mieux une tendance réellement significative
La partie disant que « la Chine est en avance en robotique » ne semble pas avoir grand-chose à voir avec l’IA. Le graphique sur la Chine suit à peu près la même trajectoire depuis 2012, donc j’ai l’impression qu’il colle mal au contexte de l’article
- Même si ChatGPT n’existait pas encore à l’époque, je pense que les technologies de ML qui faisaient avancer la robotique fonctionnaient déjà très bien à ce moment-là
Dire que « l’entraînement des modèles d’IA peut émettre énormément de carbone » est juste, mais ce que j’aimerais vraiment voir, c’est un graphique montrant combien de carbone est émis au niveau mondial pour faire tourner ces modèles en production
J’ai du mal à être d’accord avec la phrase disant que « les performances des modèles d’IA se sont améliorées à une vitesse remarquable au cours des 10 dernières années, et que ces progrès s’accélèrent ». À mes yeux, presque tous les domaines sont déjà en train d’entrer dans une phase de plateau. Certains domaines plus récents, comme les mathématiques de compétition, semblent encore moins touchés, mais au vu des tendances passées, il y a de fortes chances qu’ils finissent eux aussi par plafonner de façon similaire
Je ne comprends toujours pas très bien l’expression State of AI in 2026
Cet article semble être un doublon. Le message original est dans ce fil, et la source est le 2026 AI Index Report de Stanford HAI

Des graphiques pour expliquer l’état de l’IA en 2026

Indicateurs clés du rapport AI Index 2026

La domination américaine sur les modèles d’IA

L’avance de la Chine dans le déploiement de la robotique

Forte hausse du compute IA mondial

Émissions carbone de l’entraînement et de l’inférence IA

Accélération des performances sur benchmark des LLM

Expansion de la recherche IA dans la santé

Les limites de la lecture d’horloges analogiques

Record des investissements IA en 2025

Les ingénieurs logiciel focalisés sur l’IA

Incertitude sur l’impact de l’IA sur l’emploi

Évolution de la perception du public vis-à-vis de l’IA

Différences entre pays dans la confiance envers la régulation de l’IA

À lire aussi

1 commentaires

Commentaires sur Hacker News