4 points par GN⁺ 2025-08-23 | 1 commentaires | Partager sur WhatsApp
  • Google a publié la consommation d’électricité, d’eau et les émissions de carbone liées au traitement des prompts dans son application Gemini, fournissant pour la première fois des données concrètes sur l’usage énergétique de l’IA
  • Un prompt texte moyen consomme 0,24 Wh d’électricité, soit l’équivalent d’environ 1 seconde d’utilisation d’un micro-ondes, et génère 0,26 ml d’eau ainsi que 0,03 g de dioxyde de carbone
  • Ces chiffres proviennent d’une analyse globale incluant toute l’infrastructure, dont les puces IA (58 %), le CPU et la mémoire (25 %), les équipements de secours (10 %) et l’exploitation du datacenter (8 %)
  • Entre mai 2024 et mai 2025, l’efficacité énergétique a été améliorée d’un facteur 33, ce que Google attribue à l’optimisation logicielle et à l’amélioration des modèles
  • Cette annonce est importante en ce qu’elle marque une plus grande transparence des grandes entreprises de l’IA, mais des informations clés comme le nombre total de requêtes ne sont toujours pas publiées, ce qui relance le besoin d’un cadre standardisé d’évaluation énergétique de l’IA

Google publie la consommation énergétique des prompts Gemini

  • Google est la première grande entreprise de l’IA à publier la consommation d’électricité, les émissions de carbone et l’usage de l’eau liés au traitement des prompts texte par le modèle Gemini
  • Un prompt moyen génère 0,24 Wh d’électricité, 0,26 ml d’eau et 0,03 g de CO₂, soit un niveau comparable à 1 seconde de fonctionnement d’un micro-ondes ou à cinq gouttes d’eau
  • Cette annonce, détaillée dans une interview accordée à MIT Technology Review, explique les données et la méthode de calcul

Détail de la structure de consommation énergétique

  • Dans la consommation totale d’électricité, les puces IA (TPU) représentent 58 %, le CPU et la mémoire 25 %, les équipements de secours 10 % et l’exploitation du datacenter (refroidissement et conversion d’énergie) 8 %
  • Google explique avoir mené l’analyse selon une approche globale incluant l’ensemble de l’infrastructure matérielle
  • Il s’agit d’une publication de données internes difficilement accessibles aux chercheurs, ce qui est considéré comme une contribution utile à la recherche industrielle

Différences selon les prompts et limites

  • Les chiffres publiés sont des valeurs médianes (median), et certaines requêtes peuvent consommer beaucoup plus d’énergie
    • Exemple : résumer des dizaines de livres ou effectuer des calculs complexes avec un modèle de reasoning
  • Ce rapport ne porte que sur les prompts texte et n’inclut pas la génération d’images ou de vidéos
  • Il reste donc limité pour évaluer le volume total réel de consommation sur l’ensemble des usages de Gemini

Amélioration de l’efficacité et estimation des émissions carbone

  • Google a annoncé qu’entre mai 2024 et mai 2025, la consommation d’énergie par prompt a été divisée par 33
  • L’entreprise l’explique par des améliorations de l’architecture des modèles et par l’optimisation logicielle
  • L’estimation des émissions n’utilise pas la moyenne du réseau électrique américain, mais une approche fondée sur le marché tenant compte de la part d’énergie propre achetée par Google, ce qui aboutit à un niveau estimé à environ un tiers de celui du réseau électrique classique

Réactions des chercheurs et de l’industrie

  • Des responsables du projet ML.Energy de l’University of Michigan ont qualifié cette annonce d’analyse la plus complète et la plus importante à ce jour
  • Des chercheurs de Hugging Face ont souligné la nécessité d’un système standardisé de notation énergétique de l’IA, notant qu’aujourd’hui les entreprises ne publient que ce qu’elles choisissent de rendre public
  • Ce rapport élargit la compréhension de la consommation réelle de ressources liée à l’usage de l’IA, mais l’absence de données clés comme le nombre total de requêtes reste une limite majeure

1 commentaires

 
GN⁺ 2025-08-23
Avis Hacker News
  • Je n’ai pas trouvé dans l’article original les liens vers le communiqué associé ni vers le rapport, donc je les ajoute directement.

    Il est indiqué explicitement qu’un prompt médian (c’est-à-dire un prompt situé au milieu de la distribution de consommation énergétique) consomme 0,24 wattheure d’électricité.
    En supposant l’usage de deux RTX 6000, cela fait 600 watts au total, soit en théorie un temps de réponse de 1,44 seconde.
    Autrement dit, il est clair que ce prompt médian ne correspond pas à un modèle d’IA très performant et coûteux.
    C’est un chiffre assez faible.
    À titre de comparaison, si un véhicule électrique parcourt 363 miles avec 82 kWh, alors 0,24 Wh correspond à peu près à l’énergie nécessaire pour faire avancer un véhicule électrique de 1,7 mètre (5,6 pieds).
    Chaque fois que je vois des articles affirmant que la demande électrique de l’IA surcharge le réseau, je me demande s’il n’aurait pas déjà fallu prévoir des capacités de production excédentaires avant même le boom de l’IA, pour absorber aussi l’adoption des véhicules électriques, des plaques à induction, des pompes à chaleur, etc.
    Voir le blog officiel de Google

    • Quand je lis des articles sur la surcharge des infrastructures électriques, j’ai l’impression d’une stratégie de « dog whistle » destinée à accentuer l’idée que les entreprises technologiques nuisent à l’environnement.
      On pointe la consommation d’eau et d’électricité, mais souvent de manière excessivement sensationnaliste.
      Les critiques sur la consommation d’eau du datacenter de The Dalles en sont un bon exemple.
      Ces bâtiments sont situés au bord du fleuve Columbia, et à proximité se trouve le barrage de The Dalles, qui produit en moyenne 700 mégawatts.
      Le principe consiste à utiliser l’eau du fleuve pour le refroidissement, puis à la rejeter dans le fleuve avec une température légèrement plus élevée.
      En un sens, la chaleur est simplement rendue à l’eau qui descend déjà naturellement vers l’aval, donc ce n’est pas une perte totale.
      Article lié, infos sur le barrage de The Dalles

    • Le rapport technique officiel de Google en PDF est disponible ici

    • Je me demande pourquoi ils ont publié la consommation énergétique du prompt médian plutôt que la moyenne.
      La moyenne montrerait de façon plus intuitive la consommation réelle moyenne.

    • Concernant les VE, l’idée qu’ils deviendraient dominants d’ici 2030 n’a jamais été réaliste.
      Ni la montée en capacité de production des batteries ni les infrastructures n’étaient prêtes.

    • Les datacenters peuvent provoquer d’un coup un besoin massif d’électricité dans une petite zone géographique donnée.
      D’autres postes comme les véhicules électriques ou les pompes à chaleur sont adoptés plus progressivement, donc on peut suivre avec de faibles hausses annuelles de capacité.
      Les datacenters sont plus difficiles à répartir, donc la pression sur l’infrastructure est plus forte.

  • J’ai été surpris d’entendre récemment des gens de la génération Z dire que l’IA « détruit » l’eau.
    Ayant déjà travaillé en datacenter, je savais qu’on utilise de l’eau pour le refroidissement, mais je n’avais jamais eu l’impression qu’on la détruisait à grande échelle.
    La perception autour de la GenAI et de l’eau est plus forte que je ne le pensais.
    J’ai même entendu des propos du genre : « À cause de l’IA, on va vivre dans un enfer de sécheresse. »
    Personnellement, je serais plutôt curieux de connaître la consommation énergétique d’une seule vidéo TikTok, mais ce n’est sans doute pas vraiment comparable.
    Quand je demande par quel mécanisme l’eau disparaîtrait réellement, si elle devient de la vapeur, je trouve étrange que beaucoup de gens considèrent simplement que si elle s’évapore, elle est « perdue pour toujours ».

    • Les molécules d’eau ne sont pas « détruites », mais elles disparaissent souvent complètement des endroits où elles pouvaient être utilisées utilement.
      La mer d’Aral est l’exemple typique d’une disparition causée par l’irrigation agricole.
      Vidéo YouTube

    • La pénurie d’eau est un phénomène extrêmement local.
      Par exemple, exploiter un datacenter en Arizona peut poser un vrai problème d’eau, mais cela peut être atténué par le recyclage des eaux usées, etc.
      La centrale de Palo Verde utilise elle aussi des eaux usées dans ses échangeurs thermiques.

    • On m’a moi aussi récemment posé des questions sur la consommation d’eau de l’IA, ce qui m’a surpris.
      Après une recherche rapide, il semble que les datacenters consomment effectivement pas mal d’eau : environ 1 litre par kWh d’électricité.
      J’ai entendu dire que les hyperscalers font mieux que ce chiffre et visent même un bilan net positif, mais je trouve très peu de sources sérieuses affirmant que cette valeur est complètement fantaisiste.
      « 1 litre/kWh » est difficile à se représenter, mais pour un grand datacenter cela ferait 278 L/s. Un pommeau de douche, c’est 0,16 L/s, et toute l’industrie californienne de l’amande représente en moyenne annuelle 200 000 L/s.
      Cela correspondrait au niveau d’une exploitation d’amandiers de 4 miles carrés, mais je n’ai pas l’impression que ce soit si extrême, et les chiffres des hyperscalers sont probablement meilleurs.

    • Les datacenters utilisent du refroidissement par évaporation.
      On ne se contente pas de chauffer l’eau puis de la renvoyer : elle est entièrement évaporée dans l’atmosphère.
      (Les molécules d’eau existent toujours, mais la vapeur atmosphérique est une forme difficile à réutiliser.)

    • L’idée que l’IA détruit l’eau est née d’une logique NIMBY, puis a été reprise comme argument anti-IA par certains groupes de la génération Z à forte sensibilité anticapitaliste.

  • En 2011, Google avait annoncé 0,3 Wh par requête de recherche, et en début d’année Sam Altman a lui aussi dit qu’une requête OpenAI consommait en moyenne 0,3 Wh.
    Je trouve surprenant que les deux chiffres soient si proches.
    J’aurais pensé qu’une requête LLM serait bien plus énergivore qu’une simple recherche Google, mais cela rappelle aussi à quel point la recherche Google repose elle-même sur une infrastructure énorme.
    Par exemple, pour une question simple comme le sens d’un mot, si un petit LLM tournait sur un iPhone, 0,03 Wh suffiraient probablement, soit 10 fois moins qu’une recherche Google.
    (En supposant une puce A16 fonctionnant à 5 watts pendant 20 secondes, on obtient 0,03 Wh.)
    Ce qui m’intéresse ici, c’est de savoir si le coût de l’entraînement — surtout les runs ratés — est inclus dans ce type d’estimation.
    Billet officiel de Google

    • Il faut aussi garder à l’esprit les progrès d’efficacité énergétique réalisés en 14 ans.

    • Vers 2008, le cœur du processus de recherche consistait à faire un grep sur tous les documents.
      Les documents étaient répartis en mémoire vive de manière distribuée, et grep tournait sur 1 000 machines.
      Les index inversés étaient peu utilisés, car ils se prêtaient mal aux requêtes où « l’ordre des mots est important ».
      Les processus de ranking, eux, étaient plus complexes.

    • 0,3 Wh, c’est 1 080 joules. Un litre d’essence contient plus de 30 millions de joules, donc cela correspond en réalité à environ 0,034 millilitre d’essence.
      Cela dit, l’électricité est bien plus efficace qu’un moteur thermique.

    • À chaque fois que j’envoie une requête à mon LLM local, j’ai l’impression que les lumières du bureau vacillent et qu’il consomme plus d’énergie qu’un four allumé pendant une seconde.

    • Je me demande si, vers 2008, Google utilisait déjà de la recherche basée sur le deep learning.
      La consommation électrique par requête a probablement fluctué avec l’ajout de nouvelles fonctionnalités.

  • Je trouve regrettable que le rapport n’explique pas quel type de prompt correspond au « médian ».
    J’aimerais connaître le nombre de tokens, la distribution des longueurs, et savoir si cela reste comparable d’une année à l’autre.
    Sans ces informations, se contenter d’indiquer la médiane a en pratique peu d’intérêt.
    Avec une moyenne, on pourrait au moins multiplier par le nombre de requêtes pour estimer l’usage total.

  • Sam Altman a aussi publié récemment sur son blog la consommation moyenne d’électricité par requête ChatGPT.
    Une requête ChatGPT consommerait en moyenne 0,34 Wh, soit environ 1,5 seconde de four, ou l’équivalent en eau de quelques minutes d’une ampoule à haute efficacité.
    La consommation d’eau serait de 0,000085 gallon par requête (un quinzième de cuillère à café).
    Blog d’Altman

  • Personnellement, je pense que le vrai sujet important n’est pas l’inférence, mais l’entraînement, le fine-tuning et le scraping de données.
    La formule « les prompts détruisent l’environnement » me semble franchement trop sensationnaliste.
    Je trouve néanmoins positif qu’il y ait de plus en plus de fact-checking.
    Mais en pratique, l’impact des nouveaux datacenters sur les réseaux de transport et de distribution d’électricité ne peut pas non plus être ignoré.
    Si la technologie était fondamentalement aussi économe en énergie, on ne verrait sans doute pas les grandes entreprises investir dans le nucléaire privé ni se livrer à une telle compétition sur l’énergie.

    • Pour fixer des objectifs pertinents, il faut regarder non seulement la consommation totale d’eau et d’énergie, mais aussi la disponibilité relative de ces ressources dans chaque zone concernée.
      Google publie officiellement la consommation totale d’eau de ses datacenters.
      En 2024, elle était d’environ 10 milliards de gallons (soit environ 0,03 % de l’usage total aux États-Unis, en tenant compte du fait que tous les datacenters ne s’y trouvent pas).
      Le chiffre brut ne paraît pas énorme, mais plus d’un milliard de gallons sont consommés à Council Bluffs, dans l’Iowa, et il faut vérifier si les écosystèmes locaux peuvent l’absorber et si cela est géré de manière responsable.
      Google reconnaît que 28 % de cette consommation a lieu dans des zones présentant un « risque moyen ou élevé d’épuisement ou de rareté de l’eau ».
      Rapport environnemental 2025 de Google

    • Le simple fait de visiter un site web peut envoyer involontairement des prompts au serveur.
      Je trouve regrettable que, plus un service est bon marché à grande échelle, plus il tende à être surutilisé.

    • Je ne suis pas d’accord avec l’idée que si la consommation énergétique était fondamentalement faible, il n’y aurait pas une telle ruée vers les nouveaux datacenters et les infrastructures énergétiques.
      Le réseau électrique américain manque depuis longtemps de marges supplémentaires.
      Cela vient des gains d’efficacité énergétique et du ralentissement industriel.
      Le vrai problème n’est pas tant le datacenter lui-même que l’infrastructure de distribution électrique.
      On peut produire l’électricité, mais il y a énormément de difficultés à l’acheminer là où elle est nécessaire.
      Même les controverses autour des centrales privées relèvent davantage de la distribution que de la production.

  • Si l’on part du principe qu’un prompt médian consomme 0,24 Wh, alors cela correspond à l’énergie nécessaire pour :

    • faire fonctionner un grille-pain pendant 1 seconde
    • recharger un smartphone d’un quatre-vingtième
    • soulever 100 livres sur 6 pieds
    • l’énergie cinétique d’une balle de 9 mm
    • faire rouler une Tesla sur 6 pieds
    • Pour une technologie qui semblait magique en 2022, son efficacité énergétique me paraît remarquablement élevée.
  • Si mes calculs sont bons, 1 kWh permettrait environ 4 000 requêtes.
    Avec un tarif industriel de 0,04 $/kWh, on arriverait à 100 000 requêtes pour 1 $.
    En tenant compte des coûts de construction du datacenter, etc., l’abonnement à 20 $ par mois ne me semble finalement pas exagérément cher.
    Est-ce que mon calcul tient la route ?

    • Oui, le calcul est bon.
      L’erreur fondamentale du pessimisme autour de l’énergie et de l’eau de l’IA, c’est que l’électricité, l’eau et le foncier ont tous un coût, alors même que l’IA est proposée à très bas prix voire quasi gratuitement.
      Si l’IA absorbait réellement toute l’électricité et toute l’eau disponibles, les entreprises ne la feraient pas tourner à perte.

    • Mais il ne faut pas considérer séparément le coût de l’entraînement ?

  • Si vous voulez éviter les articles de seconde main, vous pouvez consulter directement le billet de blog Google et le PDF de l’article officiel.

  • Ce qui m’intéresserait davantage, c’est le volume total de requêtes Gemini par jour.
    Avec le seul chiffre du prompt médian, il est impossible d’estimer la demande énergétique totale.
    Sans le nombre global de requêtes, cette médiane n’a pas beaucoup de sens.

    • J’aurais trouvé la moyenne plus intuitive.
      Peut-être qu’ils ne la publient pas parce qu’elle est plus élevée.