Des chercheurs améliorent les capacités de suivi d'objets des voitures autonomes
Des chercheurs de l'Institut d'études aérospatiales de l'Université de Toronto (UTIAS) ont introduit deux outils de haute technologie qui pourraient améliorer la sécurité et la fiabilité des véhicules autonomes en améliorant la capacité de raisonnement de leurs systèmes robotiques.
Les innovations concernent le suivi multi-objets, un processus utilisé par les systèmes robotiques pour suivre la position et le mouvement des objets, notamment les véhicules, les piétons et les cyclistes, afin de planifier le trajet des voitures autonomes dans les zones densément peuplées.
Les informations de suivi sont collectées à partir de capteurs de vision par ordinateur (images de caméra 2D et scans LIDAR 3D) et filtrées à chaque horodatage, 10 fois par seconde, pour prédire le mouvement futur des objets en mouvement.
« Une fois traité, il permet au robot de développer un raisonnement sur son environnement. Par exemple, il y a un humain qui traverse la rue à l'intersection, ou un cycliste qui change de voie devant lui », explique Sandro Papais, doctorant. étudiant en UTIAS à la Faculté des Sciences Appliquées et Ingénierie. « A chaque horodatage, le logiciel du robot tente de relier les détections actuelles aux objets qu'il a vus dans le passé, mais il ne peut remonter que jusqu'à une certaine distance dans le temps. »
Dans un nouvel article présenté lors de la Conférence internationale 2024 sur la robotique et l'automatisation à Yokohama, au Japon, Papais et ses co-auteurs Robert Ren, étudiant en troisième année en sciences de l'ingénieur, et le professeur Steven Waslander, directeur du laboratoire de robotique et d'IA de Toronto de l'UTIAS, présentent Sliding Window Tracker (SWTrack) : une méthode d'optimisation basée sur un graphique qui utilise des informations temporelles supplémentaires pour éviter les objets manqués.
L'œuvre apparaît sur le serveur de prépublication arXiv.
L'outil est conçu pour améliorer les performances des méthodes de suivi, en particulier lorsque les objets sont masqués du point de vue du robot.
« SWTrack élargit la distance dans le passé qu'un robot prend en compte lors de la planification », explique Papais. « Ainsi, au lieu d'être limité par ce qu'il vient de voir il y a une image et par ce qui se passe maintenant, il peut examiner les cinq dernières secondes et ensuite essayer de raisonner à travers toutes les différentes choses qu'il a vues. »
L'équipe a testé, entraîné et validé son algorithme sur des données de terrain obtenues via nuScenes, un ensemble de données publiques à grande échelle pour les véhicules à conduite autonome qui ont circulé sur les routes des villes du monde entier. Les données incluent des annotations humaines que l'équipe a utilisées pour comparer les performances de SWTrack.
Ils ont constaté que chaque fois qu’ils prolongeaient la fenêtre temporelle, jusqu’à un maximum de cinq secondes, les performances de suivi s’amélioraient. Mais au-delà de cinq secondes, les performances de l'algorithme étaient ralenties par le temps de calcul.
« La plupart des algorithmes de suivi auraient du mal à raisonner sur certains de ces écarts temporels. Mais dans notre cas, nous avons pu valider que nous pouvons suivre sur ces périodes plus longues et maintenir un suivi plus cohérent des objets dynamiques autour de nous », explique Papaïs.
Papais dit qu'il a hâte de s'appuyer sur l'idée d'améliorer la mémoire des robots et de l'étendre à d'autres domaines de l'infrastructure robotique. « Ce n'est que le début », dit-il. « Nous travaillons sur le problème du suivi, mais également sur d'autres problèmes liés aux robots, dans lesquels nous pouvons incorporer davantage d'informations temporelles pour améliorer la perception et le raisonnement robotique. »
Un autre article, co-écrit par Chang Won (John) Lee et Waslander, étudiants à la maîtrise, présente UncertaintyTrack, une collection d'extensions pour les méthodes de suivi par détection 2D qui exploitent la détection probabiliste d'objets.
« La détection probabiliste d'objets quantifie les estimations d'incertitude de la détection d'objets », explique Lee. « L'essentiel ici est que pour les tâches critiques en matière de sécurité, vous souhaitez pouvoir savoir quand les détections prévues sont susceptibles de provoquer des erreurs dans les tâches en aval telles que le suivi de plusieurs objets. Ces erreurs peuvent se produire en raison de conditions de faible éclairage ou de problèmes de sécurité. occlusion d'objets lourds.
« Les estimations d'incertitude nous donnent une idée du moment où le modèle est douteux, c'est-à-dire du moment où il est très susceptible de donner lieu à des erreurs de prédiction. Mais il existe cette lacune car les détecteurs d'objets probabilistes ne sont actuellement pas utilisés dans le suivi d'objets multi-suivi. »
Lee a travaillé sur cet article dans le cadre de sa thèse de premier cycle en sciences de l'ingénieur. Actuellement étudiant à la maîtrise dans le laboratoire de Waslander, il mène des recherches sur la détection d'anomalies visuelles pour le Canadarm3, la contribution du Canada à l'avant-poste lunaire Gateway dirigé par les États-Unis. « Dans mes recherches actuelles, nous visons à proposer une méthode basée sur l'apprentissage en profondeur qui détecte les objets flottant dans l'espace qui présentent un risque potentiel pour le bras robotique », explique Lee.
Waslander affirme que les avancées décrites dans les deux articles s'appuient sur des travaux sur lesquels son laboratoire se concentre depuis plusieurs années.
« [The Toronto Robotics and AI Laboratory] travaille depuis plusieurs années à évaluer l'incertitude de perception et à élargir le raisonnement temporel de la robotique, car ils constituent les principaux obstacles au déploiement plus large de robots dans le monde ouvert », explique Waslander.
« Nous avons désespérément besoin de méthodes d'IA capables de comprendre la persistance des objets dans le temps, et de méthodes qui sont conscientes de leurs propres limites et qui s'arrêteront et raisonneront lorsque quelque chose de nouveau ou d'inattendu apparaît sur leur chemin. C'est ce que notre recherche vise à faire. »