Des chercheurs entraînent avec succès un modèle d’apprentissage automatique dans l’espace pour la première fois
Pour la première fois, des chercheurs ont formé un modèle d’apprentissage automatique dans l’espace, à bord d’un satellite. Cette réalisation pourrait permettre une surveillance et une prise de décision en temps réel pour une gamme d’applications, de la gestion des catastrophes à la déforestation.
Ce projet a été résumé dans une publication, « Fast model inference and training on-board of Satellites », disponible sur le serveur de prépublication arXiv. Les travaux ont également été présentés lors de la conférence International Geoscience and Remote Sensing Symposium (IGARSS) le 21 juillet 2023.
Les données recueillies par les satellites de télédétection sont fondamentales pour de nombreuses activités clés, notamment la cartographie aérienne, la prévision météorologique et la surveillance de la déforestation. Actuellement, la plupart des satellites ne peuvent collecter des données que de manière passive, car ils ne sont pas équipés pour prendre des décisions ou détecter des changements. Au lieu de cela, les données doivent être relayées sur Terre pour être traitées, ce qui prend généralement plusieurs heures, voire plusieurs jours. Cela limite la capacité d’identifier et de répondre à des événements émergents rapidement, comme une catastrophe naturelle.
Pour surmonter ces restrictions, un groupe de chercheurs dirigé par le doctorant Vít Růžička (Département d’informatique, Université d’Oxford), a relevé le défi de former le premier programme d’apprentissage automatique dans l’espace.
En 2022, l’équipe a présenté avec succès son idée à la mission Dashing through the Stars, qui avait lancé un appel ouvert à propositions de projets à réaliser à bord du satellite ION SCV004, lancé en janvier 2022. Au cours de l’automne 2022, l’équipe a transmis le code du programme au satellite déjà en orbite.
Les chercheurs ont formé un modèle simple pour détecter les changements de couverture nuageuse à partir d’images aériennes directement à bord du satellite, contrairement à la formation au sol. Le modèle était basé sur une approche appelée apprentissage en quelques coups, qui permet à un modèle d’apprendre les caractéristiques les plus importantes à rechercher lorsqu’il ne dispose que de quelques échantillons à partir desquels s’entraîner. Un avantage clé est que les données peuvent être compressées en représentations plus petites, ce qui rend le modèle plus rapide et plus efficace.
Vít Růžička a déclaré : « Le modèle que nous avons développé, appelé RaVAEn, compresse d’abord les gros fichiers d’image en vecteurs de 128 nombres. Pendant la phase d’apprentissage, le modèle apprend à ne conserver que les valeurs informatives dans ce vecteur ; celles qui se rapportent au changement. il essaie de détecter – dans ce cas, s’il y a un nuage présent ou non. Cela se traduit par une formation extrêmement rapide car il n’y a qu’un très petit modèle de classification à former.
Alors que la première partie du modèle, pour compresser les images nouvellement vues, était entraînée au sol, la seconde partie (qui décidait si l’image contenait des nuages ou non) était entraînée directement sur le satellite.
Normalement, le développement d’un modèle d’apprentissage automatique nécessiterait plusieurs cycles de formation, utilisant la puissance d’un cluster d’ordinateurs liés. En revanche, le petit modèle de l’équipe a terminé la phase d’entraînement (utilisant plus de 1 300 images) en environ une seconde et demie.
Lorsque l’équipe a testé les performances du modèle sur de nouvelles données, il a automatiquement détecté si un nuage était présent ou non en un dixième de seconde environ. Cela impliquait l’encodage et l’analyse d’une scène équivalente à une zone d’environ 4,8 x 4,8 km2 superficie (équivalent à près de 450 terrains de football).
Selon les chercheurs, le modèle pourrait facilement être adapté pour effectuer différentes tâches et utiliser d’autres formes de données. Vít Růžička a ajouté : « Après avoir réalisé cette démonstration, nous avons maintenant l’intention de développer des modèles plus avancés capables de différencier automatiquement les changements d’intérêt (par exemple les inondations, les incendies et la déforestation) et les changements naturels (tels que les changements naturels de la couleur des feuilles au fil des saisons). ). »
« Un autre objectif est de développer des modèles pour des données plus complexes, y compris des images de satellites hyperspectraux. Cela pourrait permettre, par exemple, la détection de fuites de méthane, et aurait des implications clés pour lutter contre le changement climatique. »
L’apprentissage automatique dans l’espace pourrait également aider à surmonter le problème des capteurs satellites embarqués affectés par les conditions environnementales difficiles, de sorte qu’ils nécessitent un étalonnage régulier.
Vít Růžička a déclaré: « Notre système proposé pourrait être utilisé dans des constellations de satellites non homogènes, où des informations fiables d’un satellite peuvent être appliquées pour former le reste de la constellation. Cela pourrait être utilisé, par exemple, pour recalibrer les capteurs qui se sont dégradés. au fil du temps ou a connu des changements rapides dans l’environnement. »