Amélioration du modèle d'IA U-Net pour la télédétection océanique
U-Net, un réseau neuronal convolutif (CNN) initialement destiné à un usage médical, peut potentiellement faire des vagues dans le domaine de la télédétection océanique
Il existe rarement un problème dans notre monde moderne qui ne puisse être résolu ou résolu par la technologie et l’intelligence artificielle (IA). Dans ce cas, U-Net, un outil utilisé pour extraire un « objet » souhaité d’une image médicale, est considéré comme un moyen potentiel de recherche océanographique. Bien qu’il soit prometteur, U-Net n’est pas parfait. Quelques améliorations clés du modèle peuvent faire une énorme différence dans le domaine de la télédétection océanique.
Les chercheurs ont publié leurs résultats dans le Journal de télédétection en août 2024.
Le modèle U-Net semble avoir une structure suffisamment bonne pour être un bon candidat pour la recherche océanographique, mais dans son état actuel, il n’est pas en mesure de répondre complètement aux besoins des chercheurs.
Pour résoudre les défis auxquels U-Net est confronté en s'orientant vers la recherche océanographique, trois catégories principales doivent être améliorées : les tâches de segmentation du modèle, ou la capacité à catégoriser chaque pixel d'une image, les tâches de prévision et les tâches de super-résolution.
« Grâce à l'amélioration structurelle et à l'introduction de nouvelles techniques, le modèle U-Net peut apporter une amélioration significative dans la détection de petites cibles, la précision de prédiction et la qualité de reconstruction d'image, favorisant ainsi davantage le développement de la recherche en télédétection océanique », a déclaré Haoyu Wang, auteur et chercheur.
L'amélioration de la segmentation sémantique peut améliorer la capacité d'U-Net à détecter et identifier de petites cibles dans l'océan. Cela peut être réalisé en intégrant au modèle la capacité de reconnaître et d'identifier les pixels à distance via des mécanismes d'attention. Par exemple, il est essentiel que le modèle reconnaisse la différence entre les eaux libres et les formations de glace dans l'océan, et U-Net peut déterminer cette différence.
Les tâches de prévision font référence à la capacité du modèle à prédire logiquement un résultat en se basant sur des connaissances physiques et des méthodes basées sur les données. Parmi les succès obtenus précédemment grâce au modèle U-Net pour la télédétection océanique, on peut citer le Sea Ice Prediction Network (SIPNet), qui prédit la concentration de glace de mer dans l'Antarctique.
SIPNet, le modèle U-Net, a utilisé une autre forme d'architecture de réseau neuronal connue sous le nom de « codeur-décodeur » qui traite une séquence d'entrée (codeur) pour la reconstruire ultérieurement dans sa forme originale (décodeur). Cette architecture est souvent utilisée pour résumer ou traduire un texte, mais dans ce cas, SIPNet a utilisé 8 semaines de données sur la concentration de glace de mer pour prévoir les 8 semaines suivantes. Lorsque l'architecture codeur-décodeur a été combinée à un module d'attention spatio-temporelle (TSAM), la différence moyenne entre la prédiction et la mesure réelle était inférieure à 3 % pour une prévision sur 7 jours, ce qui montre la précision que peuvent avoir les modèles U-Net lorsqu'ils sont entièrement équipés pour la tâche.
Enfin, les améliorations suggérées pour les tâches de super-résolution incluent l'introduction d'un modèle de diffusion pour réduire le flou dans les images, ou « bruit ». Pour réduire le bruit dans les images, la corrélation entre les images haute et basse résolution doit être identifiée en prenant note des similitudes observées dans les deux résolutions. Cela comprend également l'amélioration de la capacité du modèle à extraire des caractéristiques des images.
Les chercheurs suggèrent d'utiliser un modèle, PanDiff, pour mélanger les images panchromatiques haute résolution (sensibles à toutes les couleurs visibles du spectre) et les images multispectrales basse résolution (images qui capturent des données via des spectres tels que l'infrarouge et l'ultraviolet) à reconstruire par U-Net via le bruit aléatoire.
Une optimisation supplémentaire du modèle U-Net est nécessaire pour soutenir les objectifs des chercheurs à long terme.
« L'architecture réseau simple et compréhensible du modèle U-Net et ses capacités supérieures d'ajustement du modèle ont suscité la plus grande popularité parmi les chercheurs de la communauté de la télédétection océanique, démontrant un grand potentiel », a déclaré Xiaofeng Li, chercheur et auteur de l'étude.
En plus des améliorations suggérées par les chercheurs pour l’utilisation d’U-Net dans la recherche océanique, il reste encore beaucoup à explorer en combinant U-Net avec d’autres systèmes ou techniques pour étendre davantage une application déjà large du modèle.
Fourni par le Journal of Remote Sensing