Une approche d'apprentissage profond pour fournir des solutions précises 1 000 fois plus rapidement qu'auparavant
L'analyse et la simulation de l'écoulement des fluides constituent un problème mathématique complexe qui a des répercussions sur de nombreux scénarios, notamment les moteurs de jeux vidéo, la modélisation des courants océaniques et la prévision des ouragans. Le cœur de ce défi réside dans la résolution des équations de Navier-Stokes, un ensemble d'équations classiques qui décrivent la dynamique des fluides.
Récemment, l'apprentissage profond est apparu comme un outil puissant pour accélérer la résolution d'équations. En utilisant cette technique, une équipe a conçu une nouvelle approche qui peut fournir des solutions précises 1 000 fois plus rapidement que les résolveurs d'équations traditionnels. L'étude de l'équipe a été publiée le 26 juin dans Informatique intelligente.
L'équipe a testé son approche sur un problème d'écoulement de cavité à trois variables piloté par couvercle dans un grand domaine de calcul de 512 × 512. Dans l'expérience, menée sur un système de bureau grand public avec un processeur Intel Core i5 8400, leur méthode a atteint des latences d'inférence de seulement 7 millisecondes par entrée, une grande amélioration par rapport aux 10 secondes requises par les méthodes traditionnelles aux différences finies.
En plus d'être rapide, la nouvelle approche d'apprentissage profond est également peu coûteuse et hautement adaptable, ce qui lui permet de servir à réaliser des prédictions en temps réel sur des appareils numériques courants. Elle associe l'efficacité des techniques d'apprentissage supervisé à la physique nécessaire des méthodes traditionnelles.
Bien que d’autres modèles d’apprentissage supervisé puissent rapidement simuler et prédire les solutions numériques les plus proches des équations de Navier-Stokes, leurs performances sont limitées par les données de formation étiquetées, qui pourraient manquer de la taille, de la diversité et des informations physiques fondamentales nécessaires pour résoudre les équations.
Pour contourner les limitations liées aux données et réduire la charge de calcul, l'équipe a formé une série de modèles étape par étape de manière peu supervisée. Au départ, seule une quantité minimale de données de « préchauffage » précalculées a été utilisée pour faciliter l'initialisation du modèle. Cela a permis aux modèles de base de s'adapter rapidement à la dynamique fondamentale de l'écoulement des fluides avant de passer à des scénarios plus complexes et d'éliminer le besoin de vastes ensembles de données étiquetées.
Tous les modèles sont basés sur une architecture U-Net convolutionnelle, que l'équipe a personnalisée pour les problèmes complexes de dynamique des fluides. En tant qu'autoencodeur modifié, l'U-Net se compose d'un encodeur qui compresse les données d'entrée en représentations compactes et d'un décodeur qui reconstruit ces données en sorties haute résolution. L'encodeur et le décodeur sont connectés via des connexions de saut, qui aident à préserver les caractéristiques importantes et à améliorer la qualité des sorties.
Pour garantir que les résultats respectent les contraintes nécessaires, l’équipe a également développé une fonction de perte personnalisée qui intègre à la fois des composants basés sur les données et sur la physique.
Comme les méthodes traditionnelles, l'approche de l'équipe utilise une matrice 2D pour représenter le domaine de calcul, qui définit les contraintes déterminantes des problèmes de dynamique des fluides. Les contraintes comprennent des contraintes géométriques telles que la taille et la forme du domaine, des contraintes physiques telles que les caractéristiques physiques de l'écoulement et les lois physiques applicables, ainsi que des conditions aux limites qui définissent mathématiquement les problèmes.
Ce format permet d'intégrer directement des variables inconnues dans les contraintes en tant que partie des données d'entrée afin que les modèles formés puissent gérer diverses conditions limites et géométries, y compris des cas complexes invisibles.