Des chercheurs créent un cadre pour l'exploration géospatiale à grande échelle

Lors de la lutte contre des problèmes complexes tels que le braconnage illégal et la traite des êtres humains, des outils de recherche géospatiale efficaces mais étendus peuvent fournir une aide essentielle pour détecter et arrêter cette activité. Un cadre de recherche visuelle active (VAS) pour l’exploration géospatiale développé par des chercheurs de la McKelvey School of Engineering de l’Université de Washington à Saint-Louis utilise un nouveau modèle de raisonnement visuel et des images aériennes pour apprendre à rechercher des objets plus efficacement.

L’équipe dirigée par Yevgeniy Vorobeychik et Nathan Jacobs, professeurs d’informatique et d’ingénierie, vise à faire évoluer la vision par ordinateur, un domaine généralement concerné par la manière dont les ordinateurs apprennent à partir des informations visuelles, vers des applications et un impact réels. Leur cadre de pointe combine la vision par ordinateur avec l’apprentissage adaptatif pour améliorer les techniques de recherche en utilisant les recherches précédentes pour éclairer les recherches futures.

« Ce travail vise à guider les processus de recherche physique lorsque vous êtes limité dans le nombre de fois où vous pouvez réellement effectuer une recherche localement », a déclaré Jacobs. « Par exemple, si vous n’êtes autorisé à ouvrir que cinq boîtes, laquelle ouvrez-vous en premier ? Ensuite, en fonction de ce que vous avez trouvé, où effectuez-vous votre recherche ensuite ? »

L’approche de l’équipe en matière de VAS s’appuie sur les travaux antérieurs du collaborateur Roman Garnett, professeur agrégé d’informatique et d’ingénierie à McKelvey Engineering. Il associe la recherche active, un domaine dans lequel Garnett a mené des recherches pionnières, au raisonnement visuel et s’appuie sur le travail d’équipe entre les humains et l’intelligence artificielle (IA). Les humains effectuent des recherches locales et l’IA intègre des images géospatiales aériennes et des observations de personnes au sol pour guider les recherches ultérieures.

Le nouveau cadre VAS comprend trois éléments clés : une image de l’ensemble de la zone de recherche, subdivisée en régions ; une fonction de recherche locale, déterminant si un objet spécifique est présent dans une région donnée ; et un budget de recherche fixe, limitant le nombre de fois où la fonction de recherche locale peut être exécutée. L’objectif est de maximiser la détection d’objets dans le cadre du budget de recherche alloué. En effet, l’équipe a constaté que son approche surpassait toutes les lignes de base.

Le premier auteur, Anindya Sarkar, doctorante au laboratoire de Vorobeychik, a présenté les résultats le 6 janvier lors de la conférence d’hiver sur les applications de la vision par ordinateur à Waikoloa, à Hawaï. Les recherches connexes sont également disponibles sur le arXiv serveur de préimpression.

« Notre approche utilise la corrélation spatiale entre les régions pour intensifier et adapter la recherche active afin de pouvoir couvrir de vastes zones », a déclaré Sarkar.

« La nature interactive du cadre – l’apprentissage des recherches antérieures – avait été suggérée, mais la mise à jour du modèle sous-jacent était très coûteuse et finalement non évolutive pour un grand espace visuel. La mise à l’échelle avec de nombreuses données d’image constitue la grande contribution de notre nouveau VAS. « . Pour ce faire, nous avons modifié les fondamentaux sous-jacents par rapport aux techniques précédentes. «

Pour l’avenir, l’équipe prévoit d’explorer les moyens d’élargir son cadre pour l’utiliser dans diverses applications, notamment en spécialisant le modèle dans différents domaines allant de la conservation de la faune aux opérations de recherche et de sauvetage en passant par la surveillance environnementale. Ils ont récemment présenté une version hautement adaptable de leur cadre de recherche, capable de produire une recherche d’une efficacité maximale même lorsque l’objet recherché diffère considérablement des objets sur lesquels le modèle est formé.

« Le monde est différent selon les endroits, et les gens voudront rechercher des choses différentes », a déclaré Jacobs. « Notre cadre doit pouvoir s’adapter à ces deux considérations pour être efficace en tant que base d’une méthode de recherche. Nous voulons surtout que l’outil soit capable d’apprendre et de s’adapter à la volée car nous ne saurons pas toujours ce que nous avons. » que vous recherchez ou à l’avance. »