5 points par GN⁺ 2025-11-19 | 1 commentaires | Partager sur WhatsApp
  • WeatherNext 2 est un modèle basé sur l’IA qui améliore fortement la précision et l’efficacité des prévisions météorologiques mondiales
  • Il génère des centaines de scénarios météorologiques en moins d’une minute sur un seul TPU, avec une vitesse de prévision 8 fois supérieure à celle des modèles existants
  • Grâce à une nouvelle architecture Functional Generative Network (FGN), il maintient des prévisions physiquement cohérentes et prend aussi en charge une résolution horaire
  • Les données de prévision sont disponibles dans Earth Engine et BigQuery, et des capacités d’inférence personnalisée sont proposées via le programme d’accès anticipé de Vertex AI
  • Cette technologie améliore les fonctionnalités météo de nombreux services Google, dont Search, Gemini, Pixel Weather et Google Maps Platform

Aperçu de WeatherNext 2

  • Développé conjointement par Google DeepMind et Google Research, WeatherNext 2 est un modèle de prévision météorologique basé sur l’IA offrant une vitesse 8 fois supérieure et une résolution horaire
    • Il génère des centaines de scénarios météorologiques possibles à partir d’une seule entrée
    • Les prévisions sont produites en moins d’une minute sur un seul TPU, alors que les modèles physiques sur supercalculateurs existants nécessitent plusieurs heures
  • Le modèle affiche de meilleures performances que les précédents sur 99,9 % des variables et horizons de prévision (0 à 15 jours), notamment pour la température, la vitesse du vent et l’humidité
  • WeatherNext 2 permet des prévisions haute résolution à l’échelle mondiale et sert aussi à aider la prise de décision des services météorologiques

Une nouvelle approche de modélisation IA

  • WeatherNext 2 adopte une nouvelle méthode de modélisation IA appelée Functional Generative Network (FGN)
    • Du « bruit » est injecté directement dans la structure du modèle afin que les prévisions restent physiquement réalistes et interconnectées
  • Cette approche est utile à la fois pour les prévisions « marginales » (marginal) et « conjointes » (joint)
    • Les prévisions marginales concernent des éléments individuels (par exemple la température à un endroit précis, la vitesse du vent selon l’altitude ou l’humidité)
    • Les prévisions conjointes portent sur de grands systèmes météorologiques combinant plusieurs éléments, indispensables pour analyser des phénomènes complexes comme les zones de canicule ou la prévision de la production éolienne
  • Le modèle est entraîné uniquement sur des données marginales, mais apprend de lui-même les schémas conjoints pour produire des prévisions complexes

Accès et usages des données

  • Les données de prévision de WeatherNext 2 sont publiées dans Google Earth Engine et BigQuery
    • Elles peuvent être consultées via le catalogue de données Earth Engine et BigQuery Analytics Hub
  • Dans Google Cloud Vertex AI, un programme d’accès anticipé propose des fonctions d’inférence de modèle personnalisée
  • La technologie est intégrée à Search, Gemini, Pixel Weather et à la Weather API de Google Maps Platform, et devrait aussi être appliquée à l’avenir aux fonctions d’information météo de Google Maps

De la recherche au concret

  • WeatherNext 2 est un exemple d’extension de résultats de recherche vers des applications concrètes
    • Google ouvre des outils et des données afin que chercheurs, développeurs et entreprises du monde entier puissent les utiliser pour résoudre des problèmes complexes
  • À l’avenir, Google prévoit d’améliorer en continu les performances du modèle grâce à l’intégration de nouvelles sources de données et à un accès élargi
  • Google relie aussi cette initiative à Earth Engine, AlphaEarth Foundations et Earth AI afin de renforcer l’écosystème de recherche en IA géospatiale

Ressources complémentaires

  • Publication de l’article scientifique (arXiv: 2506.10772) sur WeatherNext 2
  • Mise à disposition de la documentation développeur, du catalogue de données Earth Engine, d’exemples de requêtes BigQuery et de la page d’inscription à l’accès anticipé de Vertex AI
  • Parmi les modèles associés figurent aussi GenCast (prévision météo extrême) et GraphCast (prévision rapide à l’échelle mondiale)

1 commentaires

 
GN⁺ 2025-11-19
Commentaires Hacker News
  • Je suis assez plongé dans ce sujet, et un point qui pourrait intéresser les non-initiés est que les modèles récents comme neuralgcm ou WeatherNext 1 sont tous entraînés avec une fonction objectif appelée CRPS
    Cette méthode est presque absente du ML généraliste ; je ne l’ai vue qu’en prévision météo
    En résumé, on ajoute un bruit aléatoire à l’entrée, puis on entraîne le modèle à minimiser une perte classique (L1, etc.) tout en maximisant simultanément la différence entre deux résultats produits à partir d’initialisations de bruit différentes
    Je me demande si cette approche finira un jour par s’appliquer à la GenAI plus traditionnelle

    • Je me demande si le bruit n’est pas ajouté aux paramètres du modèle plutôt qu’à l’entrée
      Ça me fait penser à l’article sur le Variational Noise
      Si le bruit est vraiment ajouté à l’entrée, alors cela ressemblerait plutôt à des techniques SSL comme DINO
    • J’ai récemment travaillé sur une optimisation où je voulais volontairement produire deux sorties différentes, mais je n’ai pas trouvé de bonne heuristique
      Ce n’était pas lié à la GenAI, mais cette approche CRPS aurait peut-être aidé
    • Cette approche me fait penser à un Variational Autoencoder
    • Je me demande quel est l’objectif de cette méthode, et pourquoi on l’utilise à la place d’une perte L2
    • Il faut préciser que, même si le modèle apprend sur des données passées, en prévision réelle il effectue plusieurs exécutions en ensemble à partir de nouvelles observations
  • J’ai l’impression que les prévisions météo locales de Google Search sont devenues sensiblement moins précises récemment
    Depuis quelques semaines, elles annoncent sans cesse des températures nocturnes sous zéro, alors que ce n’est pas ce qui se produit en réalité
    Ma région est certes difficile à prévoir, mais d’autres sources non-Google étaient bien plus exactes
    Je me demande si le déploiement du nouveau modèle a déjà eu lieu, auquel cas il aurait empiré les choses, ou si au contraire une amélioration est imminente
    J’aimerais aussi savoir s’il existe un site qui compare les performances des modèles de prévision selon les régions

    • L’API gratuite d’Open-Meteo est pratique
      Elle permet de visualiser sous forme de graphiques les prévisions de différents modèles, et inclut plusieurs grands modèles
      En revanche, WeatherNext n’y figure pas encore
    • Comparer les performances des modèles par région semble être une fonctionnalité tellement évidente, et pourtant elle n’existe presque pas. Je me demande pourquoi
  • La présentation a mis l’accent sur les gains en vitesse et en nombre de scénarios, mais j’ai trouvé qu’elle expliquait insuffisamment les améliorations de précision
    La formule « WeatherNext 2 est 8 fois plus rapide et offre une résolution horaire » sonne bien, mais en tant qu’utilisateur, au final je veux seulement une prévision juste

    • Le point important, c’est que l’utilisateur final de ce produit n’est pas le grand public
      Des métriques comme le score CRPS sont destinées aux spécialistes et servent à résoudre le problème de sous-dispersion des modèles en ensemble traditionnels
      Ce type d’amélioration constitue ensuite la base qui permet d’augmenter la précision des prévisions déterministes visibles par le grand public
      On peut consulter les technologies associées sur WeatherBench
    • Du point de vue d’un utilisateur ordinaire, l’explication était insuffisante
      Le cœur de la prévision météo repose depuis des décennies sur le concept de scénarios d’ensemble, et « 70 % de probabilité de pluie » signifie qu’il pleut dans 70 scénarios sur 100
      Autrement dit, il n’existe pas une seule « prévision juste »
    • En tant qu’utilisateur, j’aimerais aussi voir la dispersion de l’incertitude
      Beaucoup d’apps météo la montrent très bien visuellement
    • Le benchmark le plus important reste la précision, et il faut comparer avec les modèles physiques existants (GFS, ECMWF, etc.)
      Ces modèles tournent sur d’immenses clusters HPC, mais comme les calculs sont centralisés puis simplement diffusés, ils restent efficaces
    • C’est un modèle entraîné sur des données historiques, mais il semble manquer d’éléments fondés sur la physique
      Je me demande où se trouve la base physique nécessaire à de hautes performances
  • Le moteur de prévision météo de Google est déjà très performant, et ses prévisions de trajectoire des ouragans cette saison ont été impressionnamment exactes
    En revanche, le Global Forecasting System (GFS) du gouvernement américain semble se dégrader
    Article lié : lien Ars Technica

    • Je me demande ce que signifie concrètement « le GFS se dégrade »
  • En lisant l’article, je n’ai pas vu d’indication sur la fréquence à laquelle il faut réentraîner le modèle
    Si son architecture apprend des distributions locales, alors les motifs évoluent avec le temps et un réentraînement périodique semble nécessaire
    S’il faut l’entraîner trois jours par semaine, chaque semaine, cela pourrait devenir un vrai problème de coût

  • Ça m’a rappelé une anecdote datant de la Seconde Guerre mondiale
    Kenneth Arrow avait constaté que les prévisions à long terme ne valaient guère mieux que des suppositions aléatoires, mais son supérieur lui aurait répondu : « même si on sait que ça ne sert à rien, on en a besoin pour planifier »

    • J’ai entendu en cours de statistiques que, dans les faits, il fait beau bien plus souvent qu’il ne fait mauvais
      Donc, dire simplement « il ne pleuvra pas » donne raison dans 90 % des cas
      L’ironie, c’est que les prévisions météo d’autrefois étaient moins précises que ça
      Les modèles actuels sont vraiment impressionnants, au point que même les prévisions à 10 jours sont presque justes
    • Il existe aussi une interprétation selon laquelle la divination antique n’était pas qu’une simple superstition, mais un outil d’aide à la décision permettant d’agir quand on n’arrive pas à choisir, en recourant à une forme de hasard
    • Cela rappelle aussi la formule d’Eisenhower : « les plans sont inutiles, mais la planification est indispensable »
  • La précision de l’app météo par défaut de Google a baissé récemment
    Il y avait souvent des écarts de 2 à 5 degrés
    J’ai essayé l’app Weawow, recommandée sur HN ; le nom n’est pas terrible, mais la précision est excellente
    C’est de loin celle qui m’a le plus satisfait jusqu’ici

  • J’ai toujours l’impression que les prévisions météo basées sur l’IA restent éloignées de l’usage réel au quotidien
    Même par rapport à l’époque où la génération de mes parents regardait la météo à la télévision, le ressenti en matière de précision ne semble pas radicalement différent
    On voit encore de fortes pluies un jour annoncé comme ensoleillé, ou au contraire une journée entièrement claire alors que de la pluie était prévue
    Du point de vue du consommateur, on a l’impression que les progrès techniques ne se traduisent pas vraiment par une fiabilité perçue plus élevée

    • Les données existent : selon Our World in Data, la précision des prévisions s’améliore régulièrement
    • Le problème, c’est la manière de présenter les données
      Par exemple, dans Apple Weather, une « journée pluvieuse » peut être affichée dès qu’il existe une forte probabilité de pluie à un moment quelconque de la journée
      En réalité, il peut ne pleuvoir qu’à 5 heures du matin et faire beau tout le reste du temps
      Les utilisateurs doivent pouvoir interpréter les données, et ce serait bien que l’IA contextualise les prévisions selon les centres d’intérêt de chacun
    • Les prévisions continuent de s’améliorer, mais c’est une évolution progressive, pas une révolution soudaine
      Par exemple, Weathergraph a ajouté la prévision de pluie à court terme de rainbow.ai, et c’est ce que j’ai trouvé de plus précis jusqu’ici
      Les données radar elles-mêmes sont très bruitées, et leur nettoyage repose déjà sur un modèle de ML
    • En pratique, la précision s’est énormément améliorée
      Le niveau d’une prévision à 1 jour d’il y a 30 ans correspond à la précision d’une prévision à 4 jours aujourd’hui
      Mais ce n’est pas que nous comprenons mieux la météo ; c’est surtout le résultat d’une explosion de la puissance de calcul
    • Les prévisions météo ordinaires ne sont toujours pas parfaites
  • Je me demandais où l’on pouvait utiliser ce modèle
    Je cherche des prévisions hyperlocales, comme autrefois avec Dark Sky

    • Désormais, les résultats de recherche ont été intégrés à des services réels
      Les données de prévision de WeatherNext 2 sont disponibles dans Earth Engine et BigQuery, et un programme d’accès anticipé existe aussi dans Vertex AI pour de l’inférence personnalisée
      Le modèle est également utilisé dans Search, Gemini, Pixel Weather, Google Maps Platform Weather API
    • Personnellement, l’app Windy reste ma préférée
      Elle permet de comparer les écarts de prévision entre modèles, et son animation de vecteurs de vent est visuellement très intéressante
    • Le modèle HRRR est lui aussi excellent
      Il est mis à jour toutes les heures et fournit des prévisions avec une résolution de 15 minutes sur 18 heures, puis une résolution horaire sur 48 heures
      Site HRRR
    • À l’époque, Weather Underground intégrait les données de stations météo personnelles
      Cela a beaucoup changé après le rachat par IBM, mais il est possible que ce projet existe encore sous une forme ou une autre
    • Le lien officiel de l’API Weather de Google vaut aussi le détour
  • Je me demande si le modèle qui a fourni les prévisions d’ouragans les plus précises cette saison est bien le même que celui présenté ici
    Article lié : lien Ars Technica