Les modèles météorologiques IA peuvent désormais battre les meilleures prévisions traditionnelles
Un nouveau modèle de prévision météorologique d'apprentissage automatique appelé GenCast peut surpasser les meilleurs systèmes de prévision traditionnels dans au moins certaines situations, selon un article des chercheurs de Google DeepMind publié aujourd'hui dans Nature.
En utilisant une approche de modèle de diffusion similaire aux générateurs d’images d’intelligence artificielle (IA), le système génère plusieurs prévisions pour capturer le comportement complexe de l’atmosphère. Cela nécessite une fraction du temps et des ressources informatiques requis par les approches traditionnelles.
Comment fonctionnent les prévisions météorologiques
Les prévisions météorologiques que nous utilisons dans la pratique sont produites en exécutant plusieurs simulations numériques de l'atmosphère.
Chaque simulation part d'une estimation légèrement différente de la météo actuelle. En effet, nous ne savons pas exactement quel temps il fait à cet instant partout dans le monde. Pour le savoir, il faudrait des mesures de capteurs partout.
Ces simulations numériques utilisent un modèle de l'atmosphère mondiale divisé en une grille de blocs tridimensionnels. En résolvant des équations décrivant les lois physiques fondamentales de la nature, les simulations prédisent ce qui se passera dans l’atmosphère.
Connues sous le nom de modèles de circulation générale, ces simulations nécessitent beaucoup de puissance de calcul. Ils sont généralement exécutés dans des installations de calcul intensif hautes performances.
Apprentissage automatique de la météo
Ces dernières années ont vu une explosion des efforts visant à produire des modèles de prévision météorologique utilisant l’apprentissage automatique. Généralement, ces approches n’intègrent pas notre connaissance des lois de la nature comme le font les modèles de circulation générale.
La plupart de ces modèles utilisent une forme de réseau neuronal pour apprendre des modèles dans les données historiques et produire une prévision future unique. Cependant, cette approche produit des prédictions qui perdent des détails à mesure qu’elles progressent dans le futur, devenant progressivement « plus fluides ». Cette douceur n’est pas ce que nous voyons dans les systèmes météorologiques réels.
Des chercheurs du laboratoire de recherche DeepMind AI de Google viennent de publier un article dans Nature décrivant leur dernier modèle d'apprentissage automatique, GenCast.
GenCast atténue cet effet de lissage en générant un ensemble de plusieurs prévisions. Chaque prévision individuelle est moins fluide et ressemble mieux à la complexité observée dans la nature.
La meilleure estimation du futur réel provient alors de la moyenne des différentes prévisions. L’ampleur des différences entre les différentes prévisions indique le degré d’incertitude qui existe.
Selon le document GenCast, cette approche probabiliste crée des prévisions plus précises que le meilleur système de prévision météorologique numérique au monde, celui du Centre européen pour les prévisions météorologiques à moyen terme.
IA générative : pour la météo
GenCast est formé sur ce que l'on appelle les données de réanalyse des années 1979 à 2018. Ces données sont produites par le type de modèles de circulation générale dont nous avons parlé plus tôt, qui sont en outre corrigés pour ressembler à des observations météorologiques historiques réelles afin de produire une image plus cohérente de la situation. la météo du monde.
Le modèle GenCast fait des prédictions sur plusieurs variables telles que la température, la pression, l'humidité et la vitesse du vent à la surface et à 13 hauteurs différentes, sur une grille qui divise le monde en régions de latitude et de longitude de 0,25 degrés.
GenCast est ce qu'on appelle un « modèle de diffusion », similaire aux générateurs d'images IA. Cependant, au lieu de prendre du texte et de produire une image, il prend l’état actuel de l’atmosphère et produit une estimation de ce à quoi elle ressemblera dans 12 heures.
Cela fonctionne en définissant d'abord les valeurs des variables atmosphériques 12 heures dans le futur sous forme de bruit aléatoire. GenCast utilise ensuite un réseau neuronal pour trouver des structures dans le bruit compatibles avec les variables météorologiques actuelles et précédentes. Un ensemble de plusieurs prévisions peut être généré en commençant par différents bruits aléatoires.
Les prévisions s'étendent sur 15 jours, ce qui prend 8 minutes sur un seul processeur appelé unité de processeur tensoriel (TPU). C’est nettement plus rapide qu’un modèle de circulation générale. La formation du modèle a duré cinq jours en utilisant 32 TPU.
Les prévisions basées sur l’apprentissage automatique pourraient se généraliser dans les années à venir, à mesure qu’elles deviennent plus efficaces et plus fiables.
Toutefois, les prévisions météorologiques numériques classiques et les données réanalysées resteront nécessaires. Non seulement ils sont nécessaires pour fournir les conditions initiales des prévisions météorologiques du machine learning, mais ils produisent également les données d’entrée permettant d’affiner continuellement les modèles de machine learning.
Et le climat ?
Les systèmes actuels de prévision météorologique par apprentissage automatique ne sont pas adaptés aux projections climatiques, pour trois raisons.
Premièrement, pour faire des prévisions météorologiques dans les semaines à venir, vous pouvez supposer que l’océan, la terre et la glace marine ne changeront pas. Ce n’est pas le cas pour les prévisions climatiques sur plusieurs décennies.
Deuxièmement, les prévisions météorologiques dépendent fortement des détails de la météo actuelle. Cependant, les projections climatiques s'intéressent aux statistiques climatiques des décennies à venir, pour lesquelles la météo actuelle n'est pas pertinente. Les émissions futures de carbone sont le principal déterminant de l’état futur du climat.
Troisièmement, la prévision météorologique est un problème de « big data ». Il existe de grandes quantités de données d’observation pertinentes, ce dont vous avez besoin pour entraîner un modèle d’apprentissage automatique complexe.
La projection climatique est un problème de « petites données », avec relativement peu de données disponibles. En effet, les phénomènes physiques concernés (tels que le niveau de la mer ou les facteurs climatiques tels que l’oscillation australe El Niño) évoluent beaucoup plus lentement que la météo.
Il existe des moyens de résoudre ces problèmes. Une approche consiste à utiliser nos connaissances en physique pour simplifier nos modèles, ce qui signifie qu'ils nécessitent moins de données pour l'apprentissage automatique.
Une autre approche consiste à utiliser des réseaux de neurones basés sur la physique pour tenter d'ajuster les données et également de satisfaire aux lois de la nature. Une troisième consiste à utiliser la physique pour définir des « règles de base » pour un système, puis à utiliser l'apprentissage automatique pour déterminer les paramètres spécifiques du modèle.
L’apprentissage automatique a un rôle à jouer dans l’avenir des prévisions météorologiques et des projections climatiques. Toutefois, la physique fondamentale – mécanique des fluides et thermodynamique – continuera à jouer un rôle crucial.