Une technique universelle d'adaptation de domaine pour la classification d'images de télédétection

24 février 2023
fonctionnalité

Différents scénarios d’adaptation de domaine. (a) DA à ensemble fermé, qui suppose que le domaine source et le domaine cible ont des ensembles d’étiquettes partagés. (b) DA partielle, qui suppose que les ensembles d’étiquettes cibles sont considérés comme un sous-ensemble d’ensembles d’étiquettes source. (c) DA à ensemble ouvert, qui suppose que les ensembles d’étiquettes source sont considérés comme un sous-ensemble d’ensembles d’étiquettes cibles. (d) Universal DA, qui n’impose aucune connaissance préalable sur les ensembles d’étiquettes. Les ensembles d’étiquettes sont divisés en ensembles d’étiquettes partagées et privées dans chaque domaine. (e) Universal DA sans données source. L’ensemble de données source n’est pas disponible dans les scénarios universels pratiques d’AD de télédétection. Crédit: Transactions IEEE sur les géosciences et la télédétection (2023). DOI : 10.1109/TGRS.2023.3235988

Les approches d’adaptation de domaine sont des techniques conçues pour améliorer les performances des modèles informatiques dans des domaines cibles spécifiques. Ces techniques sont particulièrement utiles pour résoudre des problèmes pour lesquels il n’y a qu’une quantité limitée de données annotées pertinentes et pour lesquels la formation d’algorithmes d’apprentissage automatique est donc particulièrement difficile.

Des chercheurs de l’Université technique de Munich (TUM) ont récemment développé une approche d’adaptation de domaine universel (UniDA) qui pourrait améliorer les performances des modèles formés pour classer les images prises par des capteurs à distance. Leur article, publié dans Transactions IEEE sur les géosciences et la télédétectionintroduit une technique UniDA pour la classification des scènes d’images de télédétection ainsi qu’un nouveau réseau d’adaptation de modèle (MA) et un réseau d’adaptation de modèle basé sur la génération de données source (SDG-MA) pour UniDA sans données source.

« La plupart des approches d’adaptation de domaine (DA) existantes s’attaquent à l’écart de domaine entre différents domaines en se basant sur la connaissance de la relation entre l’espace d’étiquette source et cible (écart de catégorie), comme l’AD à ensemble fermé, l’AD partiel et l’AD à ensemble ouvert. « , a déclaré Yilei Shi, l’un des chercheurs qui a mené l’étude, à Tech Xplore.

« Ces approches ne sont généralement pas bien adaptées à la classification pratique des images de télédétection, car elles reposent sur de riches connaissances préalables sur la relation entre les ensembles d’étiquettes source et les domaines cibles, et les données source ne sont souvent pas accessibles en raison de problèmes de confidentialité. cette fin, nous proposons un réglage UniDA pratique pour la classification des scènes d’images de télédétection qui ne nécessite aucune connaissance préalable sur les ensembles d’étiquettes. »

Shi et ses collègues ont développé un cadre en deux étapes qui atteint UniDA à la fois en présence et en l’absence de données sources pertinentes. Ce cadre complète deux étapes, à savoir la génération des données sources et l’étape d’adaptation du modèle.

Au cours de la première de ces étapes, le cadre estime la distribution conditionnelle des données sources. Sur la base de ces estimations, il génère des images sources synthétiques qui correspondent à la fois au contenu et au style des images pertinentes pour une tâche donnée dans les cas où les données sources ne sont pas disponibles.

« Avec ces données source synthétiques en main, il devient une tâche UniDA de classer correctement un échantillon cible s’il appartient à n’importe quelle catégorie dans l’ensemble d’étiquettes source ou de le marquer comme « inconnu » sinon », a expliqué Shi. « Dans la deuxième étape, un nouveau poids transférable qui distingue les ensembles d’étiquettes partagées et privées dans chaque domaine favorise l’adaptation dans l’ensemble d’étiquettes partagées découvert automatiquement et reconnaît avec succès les échantillons » inconnus « . »

Une technique universelle d'adaptation de domaine pour la classification d'images de télédétection — Aperçu de l’UniDA proposé sans données sources (SDG-MA). Le modèle se compose d’une étape de génération de données source et d’une étape d’adaptation du modèle. Crédit : Xu et al.

Shi et ses collègues ont évalué leur technique UniDA dans une série de tests. Ils ont découvert que cela pouvait améliorer efficacement les performances des modèles dans les tâches de classification de scènes d’images de télédétection, que des données d’entraînement étiquetées soient disponibles ou non.

« Notre paramètre UniDA proposé pour la classification des scènes d’images de télédétection est plus pratique et plus difficile que d’autres paramètres, car il inclut des cas dans lesquels aucune information sur la distribution des données source et aucune connaissance préalable sur les ensembles d’étiquettes n’est fournie », a déclaré Shi. « Nous avons reformulé l’objectif en estimant la distribution conditionnelle plutôt que la distribution de la base de données source sur la théorie bayésienne, qui garantit théoriquement la fiabilité et l’efficacité de la génération de données. »

Dans l’ensemble, les premiers résultats suggèrent que le cadre UniDA de l’équipe est à la fois efficace et pratique. De plus, par rapport à d’autres méthodes existantes pour mesurer l’incertitude, l’approche des poids transférables proposée par Shi et ses collègues peut mieux discriminer l’incertitude, en particulier dans les cas où les distributions catégorielles sont relativement uniformes.

« Notre étude peut servir de point de départ dans un cadre UniDA difficile pour les images de télédétection », a déclaré Shi. « Sur la base de ce travail, nous pouvons résoudre deux problèmes pratiques dans le domaine de la télédétection. Premièrement, dans un scénario général, nous ne pouvons pas sélectionner les méthodes d’adaptation de domaine appropriées (DA à ensemble fermé, DA partiel ou DA à ensemble ouvert) car aucune connaissance préalable de l’ensemble d’étiquettes de domaine cible n’est donnée. Deuxièmement, nous pouvons nous attaquer aux cas dans lesquels les ensembles de données source ne sont pas disponibles.

Aujourd’hui, la formation efficace de modèles informatiques sur des tâches de télédétection dans le monde réel peut être difficile, car les ensembles de données pertinents pour des scénarios spécifiques sont rares. Par exemple, de nombreuses sociétés et utilisateurs de satellites ne partagent pas leurs données en raison de problèmes de confidentialité et de sécurité des données. Dans d’autres cas, les ensembles de données source (par exemple, des images de télédétection à haute résolution) peuvent être si volumineux que leur transfert sur d’autres plates-formes devient peu pratique ou impossible.

Le cadre UniDA proposé par cette équipe de chercheurs pourrait aider à améliorer les performances des modèles sur les tâches de télédétection, même en l’absence d’ensembles de données de formation spécifiques aux tâches. En outre, cela pourrait inspirer le développement d’approches DA similaires pour d’autres applications du monde réel pour lesquelles les données de formation sont limitées.

« Dans nos expériences, il est difficile pour le poids transférable dans l’adaptation du modèle d’ajuster un seuil optimal pour l’appliquer à toutes les tâches UniDA d’images de télédétection », a ajouté Shi. « Ainsi, dans nos futures études, nous nous concentrerons sur l’apprentissage adaptatif du seuil grâce à l’utilisation d’un classificateur à ensemble ouvert. »