Un nouveau modèle de fondation améliore la précision de l'interprétation des images de télédétection

Un nouveau modèle de fondation améliore la précision de l’interprétation des images de télédétection

Crédit : domaine public Unsplash/CC0

Un nouveau modèle de base baptisé RingMo a été développé pour améliorer la précision de l’interprétation des images de télédétection, selon l’Institut de recherche sur l’information aérospatiale (AIR) de l’Académie chinoise des sciences (CAS).

L’étude intitulée « RingMo: A Remote Sensing Foundation Model with Masked Image Modeling » a été publiée dans Transactions IEEE sur les géosciences et la télédétection.

Les images de télédétection sont appliquées dans des domaines tels que la classification et la détection des changements, et les approches d’apprentissage en profondeur ont contribué au développement rapide de l’interprétation des images de télédétection. Le paradigme de formation le plus largement utilisé est l’utilisation de modèles préformés ImageNet pour traiter les données de télédétection pour des tâches spécifiées.

Cependant, il existe des problèmes, tels qu’un écart de domaine entre les scènes de télédétection et la faible capacité de généralisation des modèles de télédétection. Ainsi, il est nécessaire de développer un modèle de base avec une représentation générale des caractéristiques de télédétection. Puisqu’une grande quantité de données non étiquetées est disponible, la méthode auto-supervisée est meilleure que la méthode entièrement supervisée en télédétection.

L’étude vise à proposer un cadre de modèle de base de télédétection, qui peut tirer parti des avantages de l’apprentissage auto-supervisé génératif pour les images de télédétection. RingMo propose un ensemble de données à grande échelle construit en collectant 2 millions d’images de télédétection à partir de plates-formes satellitaires et aériennes, couvrant plusieurs scènes et objets à travers le monde. De plus, la méthode de formation du modèle de base de télédétection est conçue pour les objets denses et petits dans des scènes de télédétection complexes.

RingMo est le premier modèle de base génératif pour les données de télédétection intermodales. À l’avenir, le modèle pourra être appliqué à la reconstruction 3D, à la construction résidentielle, au transport, à la conservation de l’eau, à la protection de l’environnement et à d’autres domaines.


Fourni par l’Académie chinoise des sciences