Le modèle combine des paramètres physiques et un apprentissage automatique pour prédire les marées de tempête
La prévision des événements extrêmes est essentielle à la préparation et à la protection des régions vulnérables, surtout à l’heure du changement climatique. La ville de Santos, sur la côte de l'État de São Paulo (Brésil), est le plus grand port d'Amérique latine et a fait l'objet d'études de cas importantes, notamment en raison des ondes de tempête qui menacent ses infrastructures et les écosystèmes locaux.
Un article rapportant les résultats d'une étude axée sur une partie critique de Santos et utilisant des outils avancés d'apprentissage automatique pour optimiser les systèmes de prévision d'événements extrêmes existants a été publié dans Actes de la conférence AAAI sur l'intelligence artificielle.
Il a mobilisé un grand nombre de chercheurs et a été coordonné par Anna Helena Reali Costa, professeur titulaire à l'École d'ingénieurs de l'Université de São Paulo (POLI-USP). Le premier auteur est Marcel Barros, chercheur au Département de génie informatique et de systèmes numériques de POLI-USP.
Les modèles utilisés pour prédire les hauteurs de la mer, les marées hautes, la hauteur des vagues, etc. sont basés sur des équations différentielles comprenant des informations temporelles et spatiales telles que la marée astronomique (déterminée par les positions relatives du soleil, de la lune et de la Terre), le régime des vents, le courant. la vitesse et la salinité, entre autres.
Ces modèles réussissent dans plusieurs domaines mais ils sont complexes et dépendent d’un certain nombre de simplifications et d’hypothèses. De plus, de nouvelles mesures et autres sources de données ne peuvent pas toujours y être intégrées pour fiabiliser les prévisions.
Bien que les modélisateurs utilisent de plus en plus des méthodes d’apprentissage automatique capables d’identifier des modèles dans les données et d’extrapoler à de nouvelles situations, de nombreux exemples sont nécessaires pour entraîner les algorithmes qui exécutent des tâches complexes telles que celles impliquées dans la prévision météorologique et la prévision des marées de tempête.
« Notre étude a combiné les deux mondes pour développer un modèle basé sur l'apprentissage automatique qui utilise des modèles physiques comme point de départ mais les affine en ajoutant des données mesurées. Ce domaine de recherche est connu sous le nom d'apprentissage automatique basé sur la physique, ou PIML », a expliqué Barros.
L'harmonisation de ces deux sources d'information est fondamentale pour élaborer des prévisions plus précises et exactes. Cependant, l’utilisation des données de capteurs se heurte à d’importants défis techniques, notamment en raison de leur caractère irrégulier et de problèmes tels que des données manquantes, des déplacements temporels et des variations des fréquences d’échantillonnage. Les capteurs qui tombent en panne peuvent mettre des jours à être remis en ligne, mais les mécanismes de prévision des marées de tempête doivent être capables de fonctionner en continu sans les données manquantes.
« Pour faire face à des situations avec des données très irrégulières, nous avons développé une technique innovante pour représenter le temps qui passe dans les réseaux de neurones. Cette représentation permet d'indiquer au modèle la position et la taille des fenêtres de données manquantes, afin qu'il les prenne en compte dans ses prédictions de données. la hauteur des marées et des vagues », a déclaré Barros.
L'innovation permet une meilleure modélisation de phénomènes naturels complexes et peut également être utilisée pour modéliser d'autres phénomènes impliquant des séries temporelles irrégulières, tels que les données de santé, les réseaux de capteurs dans le secteur manufacturier ou les indicateurs financiers.
« En outre, notre modèle combine différents types de réseaux neuronaux afin d'intégrer des données multimodales, telles que des images satellite, des tableaux et des prévisions issues de modèles numériques, avec une éventuelle intégration future d'autres types de données, telles que du texte et de l'audio. Cette approche est une une étape importante vers des systèmes de prévision plus robustes et adaptables, capables de gérer la complexité et la variabilité des données associées aux événements météorologiques extrêmes », a déclaré Reali Costa.
Le modèle a trois vertus clés, a-t-elle ajouté : il combine des modèles physiques et numériques ; il représente le temps dans les réseaux de neurones d'une nouvelle manière ; et il fonctionne avec des données dans différents formats grâce à une architecture multimodale.
« L'étude propose une méthodologie qui peut améliorer la précision des prévisions d'événements extrêmes, tels que les marées de tempête à Santos. En même temps, elle met en évidence les défis et les solutions potentielles pour l'intégration de modèles physiques et de données de capteurs dans des contextes complexes. » dit-elle.