Une étude montre comment l’apprentissage automatique pourrait prédire des événements désastreux rares, comme des tremblements de terre ou des pandémies
Lorsqu’il s’agit de prédire les catastrophes provoquées par des événements extrêmes (pensez aux tremblements de terre, aux pandémies ou aux « ondes scélérates » qui pourraient détruire les structures côtières), la modélisation informatique est confrontée à un défi presque insurmontable : statistiquement parlant, ces événements sont si rares qu’il n’y a tout simplement pas assez de données. sur eux d’utiliser des modèles prédictifs pour prévoir avec précision quand ils se produiront ensuite.
Mais une équipe de chercheurs de l’Université Brown et du Massachusetts Institute of Technology affirme qu’il n’est pas nécessaire qu’il en soit ainsi.
Dans un nouvelle étude dans Science computationnelle de la natureles scientifiques décrivent comment ils ont combiné des algorithmes statistiques – qui ont besoin de moins de données pour faire des prédictions précises et efficaces – avec une puissante technique d’apprentissage automatique développée à Brown et l’ont formé pour prédire des scénarios, des probabilités et parfois même la chronologie d’événements rares malgré le manque de dossier historique sur eux.
Ce faisant, l’équipe de recherche a découvert que ce nouveau cadre peut fournir un moyen de contourner le besoin de quantités massives de données qui sont traditionnellement nécessaires pour ces types de calculs, en réduisant essentiellement le grand défi de prédire des événements rares à une question de qualité. sur la quantité.
« Vous devez réaliser que ce sont des événements stochastiques », a déclaré George Karniadakis, professeur de mathématiques appliquées et d’ingénierie à Brown et auteur de l’étude. « Une explosion de pandémie comme COVID-19, une catastrophe environnementale dans le golfe du Mexique, un tremblement de terre, d’énormes incendies de forêt en Californie, une vague de 30 mètres qui fait chavirer un navire – ce sont des événements rares et parce qu’ils sont rares, nous ne avons beaucoup de données historiques. Nous n’avons pas assez d’échantillons du passé pour les prédire plus loin dans le futur. La question que nous abordons dans le document est : quelles sont les meilleures données possibles que nous pouvons utiliser pour minimiser le nombre de points de données dont nous avons besoin ? »
Les chercheurs ont trouvé la réponse dans une technique d’échantillonnage séquentiel appelée apprentissage actif. Ces types d’algorithmes statistiques sont non seulement capables d’analyser les données qui y sont entrées, mais plus important encore, ils peuvent apprendre des informations pour étiqueter de nouveaux points de données pertinents qui sont tout aussi ou même plus importants pour le résultat qui est calculé. Au niveau le plus élémentaire, ils permettent de faire plus avec moins.
C’est essentiel pour le modèle d’apprentissage automatique que les chercheurs ont utilisé dans l’étude. Appelé DeepOnet, le modèle est un type de réseau de neurones artificiels, qui utilise des nœuds interconnectés en couches successives qui imitent grossièrement les connexions établies par les neurones dans le cerveau humain. DeepOnet est connu comme un opérateur neuronal profond. Il est plus avancé et plus puissant que les réseaux de neurones artificiels typiques car il s’agit en fait de deux réseaux de neurones en un, traitant les données dans deux réseaux parallèles. Cela lui permet d’analyser des ensembles géants de données et de scénarios à une vitesse vertigineuse pour cracher des ensembles de probabilités tout aussi massifs une fois qu’il apprend ce qu’il recherche.
Le goulot d’étranglement de cet outil puissant, en particulier en ce qui concerne les événements rares, est que les opérateurs neuronaux profonds ont besoin de tonnes de données à former pour effectuer des calculs efficaces et précis.
Dans l’article, l’équipe de recherche montre que, combiné à des techniques d’apprentissage actif, le modèle DeepOnet peut être formé sur les paramètres ou les précurseurs à rechercher qui conduisent à l’événement désastreux que quelqu’un analyse, même lorsqu’il n’y a pas beaucoup de points de données.
« L’idée maîtresse n’est pas de prendre toutes les données possibles et de les mettre dans le système, mais de rechercher de manière proactive les événements qui signifieront les événements rares », a déclaré Karniadakis. « Nous n’avons peut-être pas beaucoup d’exemples de l’événement réel, mais nous pouvons avoir ces précurseurs. Grâce aux mathématiques, nous les identifions, ce qui, avec des événements réels, nous aidera à former cet opérateur avide de données. »
Dans l’article, les chercheurs appliquent l’approche pour identifier les paramètres et différentes plages de probabilités de pics dangereux pendant une pandémie, trouver et prédire les vagues scélérates et estimer quand un navire se fissurera en deux en raison du stress. Par exemple, avec des vagues scélérates – celles qui sont plus grandes que deux fois la taille des vagues environnantes – les chercheurs ont découvert qu’ils pouvaient découvrir et quantifier quand les vagues scélérates se formeront en examinant les conditions de vagues probables qui interagissent de manière non linéaire au fil du temps, conduisant à des vagues parfois trois fois plus importantes. leur taille d’origine.
Les chercheurs ont découvert que leur nouvelle méthode surpassait les efforts de modélisation plus traditionnels et ils pensent qu’elle présente un cadre capable de découvrir et de prédire efficacement toutes sortes d’événements rares.
Dans l’article, l’équipe de recherche explique comment les scientifiques devraient concevoir de futures expériences afin de minimiser les coûts et d’augmenter la précision des prévisions. Karniadakis, par exemple, travaille déjà avec des scientifiques de l’environnement pour utiliser la nouvelle méthode pour prévoir les événements climatiques, tels que les ouragans.
L’étude a été dirigée par Ethan Pickering et Themistoklis Sapsis du MIT. DeepOnet était introduit en 2019 par Karniadakis et d’autres chercheurs de Brown. Ils cherchent actuellement un brevet pour la technologie.