Un nouveau modèle d'intelligence artificielle codé en physique aide à apprendre la dynamique spatio-temporelle

Un nouveau modèle d’intelligence artificielle codé en physique aide à apprendre la dynamique spatio-temporelle

Architecture schématique du PeRCNN. Crédit : UCAS

Le professeur Liu Yang de l’Université de l’Académie chinoise des sciences (UCAS), en collaboration avec ses collègues de l’Université Renmin de Chine et du Massachusetts Institute of Technology, a proposé un nouveau réseau, à savoir le réseau neuronal convolutif récurrent codé en physique (PeRCNN ), pour la modélisation et la découverte de systèmes dynamiques spatio-temporels non linéaires basés sur des données éparses et bruitées.

L’approche peut être appliquée à une variété de problèmes tels que les processus de réaction-diffusion et d’autres systèmes d’équations différentielles partielles (PDE), y compris l’analyse directe et inverse, la modélisation basée sur les données et la découverte des PDE. Les connaissances physiques antérieures sont « codées » de force, ce qui donne au réseau une interprétabilité.

En particulier, les chercheurs ont proposé un cadre d’apprentissage en profondeur qui encode de force une structure physique donnée dans un réseau neuronal convolutionnel récurrent pour faciliter l’apprentissage de la dynamique spatio-temporelle dans des régimes de données clairsemés. L’article est publié dans la revue Intelligence des machines naturelles.

Ils ont constaté qu’un tel paradigme informatique présente une précision, une robustesse, une interprétabilité et une généralisabilité élevées, et ont démontré les capacités de l’architecture de réseau proposée en l’appliquant à diverses tâches de modélisation scientifique de la dynamique spatio-temporelle telles que les processus de réaction-diffusion.

En général, prédire l’évolution de systèmes dynamiques spatio-temporels complexes est une tâche difficile dans de nombreux cas en raison de connaissances préalables insuffisantes et de l’absence d’une formulation EDP explicite pour décrire le processus non linéaire des variables du système. Les méthodes d’apprentissage automatique conventionnelles doivent s’appuyer sur une grande quantité de données d’apprentissage et souffrent de problèmes tels qu’une mauvaise interprétabilité, une faible généralisation et des erreurs de modélisation incontrôlables.

Un nouveau modèle d'intelligence artificielle codé en physique aide à apprendre la dynamique spatio-temporelle

Courbe de propagation des erreurs de la prédiction et des instantanés extrapolés de chaque modèle basé sur les données par rapport à la solution de référence. Crédit : UCAS

Grâce au développement récent des approches pilotées par les données, il est possible d’apprendre la dynamique spatio-temporelle à partir des données de mesure tout en ajoutant des connaissances préalables en physique. Cependant, les paradigmes d’apprentissage automatique basés sur la physique existants imposent des lois physiques ou des équations gouvernantes par le biais de contraintes de pénalité douce, et la qualité de la solution dépend en grande partie d’un réglage approprié des hyperparamètres par essais et erreurs. Par conséquent, il est d’une grande nécessité de développer un nouveau modèle d’apprentissage intégré aux connaissances pour apprendre la dynamique spatio-temporelle sous-jacente à partir des données.

Selon les chercheurs, un avantage majeur du PeRCNN est que les connaissances physiques antérieures peuvent être encodées dans le réseau, ce qui garantit que le réseau résultant obéit strictement à la physique donnée. Cela présente des avantages significatifs dans l’amélioration de la convergence et de la précision du modèle. En codant la structure physique donnée dans le réseau neuronal convolutif récurrent, les performances de modélisation des systèmes dynamiques spatio-temporels basés sur des données rares et bruitées ont été améliorées.

Grâce à des expériences numériques approfondies, ils ont montré comment l’approche proposée peut être appliquée pour modéliser et découvrir une variété de processus de réaction-diffusion et d’autres systèmes PDE. En comparant l’approche proposée avec certaines méthodes existantes (également appelées modèles de référence), ils ont constaté que l’approche surpasse systématiquement (mais pas aussi bien que) les références de référence considérées sous différents niveaux de bruit et richesse de données.

De plus, les chercheurs ont intégré la technique de régression parcimonieuse au modèle PeRCNN pour découvrir la forme explicite des PDE. L’ensemble de la procédure se compose de trois étapes : reconstruction des données, régression parcimonieuse et ajustement des coefficients.

Un nouveau modèle d'intelligence artificielle codé en physique aide à apprendre la dynamique spatio-temporelle

Organigramme de la découverte des EDP gouvernantes. Crédit : UCAS

Cette étude devrait faire progresser le développement de la modélisation basée sur les données de systèmes dynamiques spatio-temporels complexes, en fournissant aux scientifiques et aux ingénieurs des outils plus puissants pour comprendre et prédire les phénomènes naturels et techniques.

L’approche, qui combine l’apprentissage en profondeur et leurs connaissances préalables en physique, devrait être applicable dans plusieurs disciplines et jouer un rôle important, notamment la mécanique des fluides, la biochimie, les sciences de l’environnement, l’ingénierie, la science des matériaux, etc.

Les chercheurs attendent avec impatience de voir le développement et l’application de cette nouvelle approche, qui pourrait percer davantage de mystères sur les systèmes dynamiques spatio-temporels complexes et apporter de nouvelles percées pour le développement scientifique et technologique futur.