Savoir s’il pleut et combien il pleut améliore les modèles d’apprentissage en profondeur
Se concentrer sur une chose à la fois peut sembler être une bonne stratégie lorsque vous essayez d’apprendre quelque chose. Mais maintenant, des chercheurs de l’Institut des sciences industrielles de l’Université de Tokyo ont découvert que l’apprentissage simultané de deux tâches aide un modèle d’apprentissage en profondeur à mieux fonctionner sur les deux lors de la récupération d’informations sur les précipitations à partir de données satellitaires.
L’article, « Apprentissage multi-tâches pour les récupérations simultanées d’estimations de précipitations micro-ondes passives et de classification pluie/sans pluie », a été publié dans Lettres de recherche géophysique.
Savoir où il pleut et combien de pluie tombe dans le monde est une information essentielle dans des domaines tels que la recherche sur le climat, la gestion des ressources en eau et les prévisions météorologiques. Ces informations peuvent être obtenues à partir des données d’images hyperfréquences passives des satellites en orbite terrestre basse, mais les précipitations doivent être identifiées et estimées à partir des données brutes.
« Récemment, les approches d’apprentissage en profondeur basées sur deux réseaux ont obtenu de bons résultats », déclare Takumi Bannai, auteur principal de l’article. « Cependant, notre objectif était d’appliquer l’apprentissage multitâche à ce problème pour voir si nous pouvions encore améliorer les performances. »
Les approches conventionnelles d’apprentissage en profondeur divisent la tâche en deux étapes. Le premier détermine s’il pleut dans une zone et est résolu à l’aide d’un réseau de classification, qui génère des classes telles que « pluie » ou « pas de pluie ». La seconde détermine la quantité de pluie qui tombe. Il utilise un réseau de régression, qui produit une valeur numérique à la place.
En revanche, le réseau d’apprentissage multi-tâches est un réseau unique avec deux nœuds de sortie, un pour la classification et un pour la régression. Le réseau a d’abord été brièvement entraîné sur la tâche de classification (« pluie » ou « pas de pluie »), puis brièvement entraîné sur la tâche de régression (intensité de la pluie), et enfin entraîné sur les deux tâches jusqu’à convergence.
Cette approche a été comparée à un modèle de régression uniquement et à des produits d’estimation des précipitations existants. Les données de la mission Global Precipitation Measurement, un réseau international de satellites qui mesurent les précipitations depuis 2014, ont été utilisées. La méthode proposée a récupéré des taux de pluie qui étaient plus précis que les taux des autres approches. « Nous pensons que le modèle a obtenu ces résultats car il est capable de transférer ou de partager des connaissances entre les tâches », déclare l’auteur correspondant, Hyungjun Kim, également affilié à l’Institut coréen avancé des sciences et technologies (KAIST). « Cela indique que l’apprentissage multi-tâches est un bon moyen d’améliorer nos modèles d’apprentissage en profondeur, en particulier lorsque les tâches sont basées sur les mêmes mécanismes physiques, comme dans ce cas. »
À l’avenir, les chercheurs prévoient d’étendre le modèle pour prendre en compte encore plus de tâches, telles que la classification du type de pluie. Une autre possibilité intéressante consiste à utiliser l’apprentissage multitâche pour intégrer les connaissances préalables sur la microphysique des nuages. Pour l’instant, le nouveau cadre peut être utilisé pour améliorer les estimations actuelles des précipitations à partir des données satellitaires.