- WeatherNext 2 est un modèle basé sur l’IA qui améliore fortement la précision et l’efficacité des prévisions météorologiques mondiales
- Il génère des centaines de scénarios météorologiques en moins d’une minute sur un seul TPU, avec une vitesse de prévision 8 fois supérieure à celle des modèles existants
- Grâce à une nouvelle architecture Functional Generative Network (FGN), il maintient des prévisions physiquement cohérentes et prend aussi en charge une résolution horaire
- Les données de prévision sont disponibles dans Earth Engine et BigQuery, et des capacités d’inférence personnalisée sont proposées via le programme d’accès anticipé de Vertex AI
- Cette technologie améliore les fonctionnalités météo de nombreux services Google, dont Search, Gemini, Pixel Weather et Google Maps Platform
Aperçu de WeatherNext 2
- Développé conjointement par Google DeepMind et Google Research, WeatherNext 2 est un modèle de prévision météorologique basé sur l’IA offrant une vitesse 8 fois supérieure et une résolution horaire
- Il génère des centaines de scénarios météorologiques possibles à partir d’une seule entrée
- Les prévisions sont produites en moins d’une minute sur un seul TPU, alors que les modèles physiques sur supercalculateurs existants nécessitent plusieurs heures
- Le modèle affiche de meilleures performances que les précédents sur 99,9 % des variables et horizons de prévision (0 à 15 jours), notamment pour la température, la vitesse du vent et l’humidité
- WeatherNext 2 permet des prévisions haute résolution à l’échelle mondiale et sert aussi à aider la prise de décision des services météorologiques
Une nouvelle approche de modélisation IA
- WeatherNext 2 adopte une nouvelle méthode de modélisation IA appelée Functional Generative Network (FGN)
- Du « bruit » est injecté directement dans la structure du modèle afin que les prévisions restent physiquement réalistes et interconnectées
- Cette approche est utile à la fois pour les prévisions « marginales » (marginal) et « conjointes » (joint)
- Les prévisions marginales concernent des éléments individuels (par exemple la température à un endroit précis, la vitesse du vent selon l’altitude ou l’humidité)
- Les prévisions conjointes portent sur de grands systèmes météorologiques combinant plusieurs éléments, indispensables pour analyser des phénomènes complexes comme les zones de canicule ou la prévision de la production éolienne
- Le modèle est entraîné uniquement sur des données marginales, mais apprend de lui-même les schémas conjoints pour produire des prévisions complexes
Accès et usages des données
- Les données de prévision de WeatherNext 2 sont publiées dans Google Earth Engine et BigQuery
- Elles peuvent être consultées via le catalogue de données Earth Engine et BigQuery Analytics Hub
- Dans Google Cloud Vertex AI, un programme d’accès anticipé propose des fonctions d’inférence de modèle personnalisée
- La technologie est intégrée à Search, Gemini, Pixel Weather et à la Weather API de Google Maps Platform, et devrait aussi être appliquée à l’avenir aux fonctions d’information météo de Google Maps
De la recherche au concret
- WeatherNext 2 est un exemple d’extension de résultats de recherche vers des applications concrètes
- Google ouvre des outils et des données afin que chercheurs, développeurs et entreprises du monde entier puissent les utiliser pour résoudre des problèmes complexes
- À l’avenir, Google prévoit d’améliorer en continu les performances du modèle grâce à l’intégration de nouvelles sources de données et à un accès élargi
- Google relie aussi cette initiative à Earth Engine, AlphaEarth Foundations et Earth AI afin de renforcer l’écosystème de recherche en IA géospatiale
Ressources complémentaires
- Publication de l’article scientifique (arXiv: 2506.10772) sur WeatherNext 2
- Mise à disposition de la documentation développeur, du catalogue de données Earth Engine, d’exemples de requêtes BigQuery et de la page d’inscription à l’accès anticipé de Vertex AI
- Parmi les modèles associés figurent aussi GenCast (prévision météo extrême) et GraphCast (prévision rapide à l’échelle mondiale)
1 commentaires
Commentaires Hacker News
Je suis assez plongé dans ce sujet, et un point qui pourrait intéresser les non-initiés est que les modèles récents comme neuralgcm ou WeatherNext 1 sont tous entraînés avec une fonction objectif appelée CRPS
Cette méthode est presque absente du ML généraliste ; je ne l’ai vue qu’en prévision météo
En résumé, on ajoute un bruit aléatoire à l’entrée, puis on entraîne le modèle à minimiser une perte classique (L1, etc.) tout en maximisant simultanément la différence entre deux résultats produits à partir d’initialisations de bruit différentes
Je me demande si cette approche finira un jour par s’appliquer à la GenAI plus traditionnelle
Ça me fait penser à l’article sur le Variational Noise
Si le bruit est vraiment ajouté à l’entrée, alors cela ressemblerait plutôt à des techniques SSL comme DINO
Ce n’était pas lié à la GenAI, mais cette approche CRPS aurait peut-être aidé
J’ai l’impression que les prévisions météo locales de Google Search sont devenues sensiblement moins précises récemment
Depuis quelques semaines, elles annoncent sans cesse des températures nocturnes sous zéro, alors que ce n’est pas ce qui se produit en réalité
Ma région est certes difficile à prévoir, mais d’autres sources non-Google étaient bien plus exactes
Je me demande si le déploiement du nouveau modèle a déjà eu lieu, auquel cas il aurait empiré les choses, ou si au contraire une amélioration est imminente
J’aimerais aussi savoir s’il existe un site qui compare les performances des modèles de prévision selon les régions
Elle permet de visualiser sous forme de graphiques les prévisions de différents modèles, et inclut plusieurs grands modèles
En revanche, WeatherNext n’y figure pas encore
La présentation a mis l’accent sur les gains en vitesse et en nombre de scénarios, mais j’ai trouvé qu’elle expliquait insuffisamment les améliorations de précision
La formule « WeatherNext 2 est 8 fois plus rapide et offre une résolution horaire » sonne bien, mais en tant qu’utilisateur, au final je veux seulement une prévision juste
Des métriques comme le score CRPS sont destinées aux spécialistes et servent à résoudre le problème de sous-dispersion des modèles en ensemble traditionnels
Ce type d’amélioration constitue ensuite la base qui permet d’augmenter la précision des prévisions déterministes visibles par le grand public
On peut consulter les technologies associées sur WeatherBench
Le cœur de la prévision météo repose depuis des décennies sur le concept de scénarios d’ensemble, et « 70 % de probabilité de pluie » signifie qu’il pleut dans 70 scénarios sur 100
Autrement dit, il n’existe pas une seule « prévision juste »
Beaucoup d’apps météo la montrent très bien visuellement
Ces modèles tournent sur d’immenses clusters HPC, mais comme les calculs sont centralisés puis simplement diffusés, ils restent efficaces
Je me demande où se trouve la base physique nécessaire à de hautes performances
Le moteur de prévision météo de Google est déjà très performant, et ses prévisions de trajectoire des ouragans cette saison ont été impressionnamment exactes
En revanche, le Global Forecasting System (GFS) du gouvernement américain semble se dégrader
Article lié : lien Ars Technica
En lisant l’article, je n’ai pas vu d’indication sur la fréquence à laquelle il faut réentraîner le modèle
Si son architecture apprend des distributions locales, alors les motifs évoluent avec le temps et un réentraînement périodique semble nécessaire
S’il faut l’entraîner trois jours par semaine, chaque semaine, cela pourrait devenir un vrai problème de coût
Ça m’a rappelé une anecdote datant de la Seconde Guerre mondiale
Kenneth Arrow avait constaté que les prévisions à long terme ne valaient guère mieux que des suppositions aléatoires, mais son supérieur lui aurait répondu : « même si on sait que ça ne sert à rien, on en a besoin pour planifier »
Donc, dire simplement « il ne pleuvra pas » donne raison dans 90 % des cas
L’ironie, c’est que les prévisions météo d’autrefois étaient moins précises que ça
Les modèles actuels sont vraiment impressionnants, au point que même les prévisions à 10 jours sont presque justes
La précision de l’app météo par défaut de Google a baissé récemment
Il y avait souvent des écarts de 2 à 5 degrés
J’ai essayé l’app Weawow, recommandée sur HN ; le nom n’est pas terrible, mais la précision est excellente
C’est de loin celle qui m’a le plus satisfait jusqu’ici
J’ai toujours l’impression que les prévisions météo basées sur l’IA restent éloignées de l’usage réel au quotidien
Même par rapport à l’époque où la génération de mes parents regardait la météo à la télévision, le ressenti en matière de précision ne semble pas radicalement différent
On voit encore de fortes pluies un jour annoncé comme ensoleillé, ou au contraire une journée entièrement claire alors que de la pluie était prévue
Du point de vue du consommateur, on a l’impression que les progrès techniques ne se traduisent pas vraiment par une fiabilité perçue plus élevée
Par exemple, dans Apple Weather, une « journée pluvieuse » peut être affichée dès qu’il existe une forte probabilité de pluie à un moment quelconque de la journée
En réalité, il peut ne pleuvoir qu’à 5 heures du matin et faire beau tout le reste du temps
Les utilisateurs doivent pouvoir interpréter les données, et ce serait bien que l’IA contextualise les prévisions selon les centres d’intérêt de chacun
Par exemple, Weathergraph a ajouté la prévision de pluie à court terme de rainbow.ai, et c’est ce que j’ai trouvé de plus précis jusqu’ici
Les données radar elles-mêmes sont très bruitées, et leur nettoyage repose déjà sur un modèle de ML
Le niveau d’une prévision à 1 jour d’il y a 30 ans correspond à la précision d’une prévision à 4 jours aujourd’hui
Mais ce n’est pas que nous comprenons mieux la météo ; c’est surtout le résultat d’une explosion de la puissance de calcul
Je me demandais où l’on pouvait utiliser ce modèle
Je cherche des prévisions hyperlocales, comme autrefois avec Dark Sky
Les données de prévision de WeatherNext 2 sont disponibles dans Earth Engine et BigQuery, et un programme d’accès anticipé existe aussi dans Vertex AI pour de l’inférence personnalisée
Le modèle est également utilisé dans Search, Gemini, Pixel Weather, Google Maps Platform Weather API
Elle permet de comparer les écarts de prévision entre modèles, et son animation de vecteurs de vent est visuellement très intéressante
Il est mis à jour toutes les heures et fournit des prévisions avec une résolution de 15 minutes sur 18 heures, puis une résolution horaire sur 48 heures
Site HRRR
Cela a beaucoup changé après le rachat par IBM, mais il est possible que ce projet existe encore sous une forme ou une autre
Je me demande si le modèle qui a fourni les prévisions d’ouragans les plus précises cette saison est bien le même que celui présenté ici
Article lié : lien Ars Technica