Une nouvelle méthode améliore la reconstruction de scènes pour tester des modèles de conduite autonome

Une nouvelle méthode améliore la reconstruction de scènes pour tester des modèles de conduite autonome

Développer des véhicules capables de fonctionner en toute sécurité sans conducteur humain est un objectif clé de nombreuses équipes de la communauté de recherche en IA. Comme il serait à la fois dangereux et irréalisable de tester uniquement des véhicules autonomes dans des rues réelles, leurs algorithmes sous-jacents sont d’abord entraînés et testés de manière approfondie dans des simulations.

Même si les plateformes de simulation utilisées pour entraîner des modèles à la conduite autonome se sont considérablement améliorées ces dernières années, elles présentent souvent diverses limites. Il existe deux types de techniques de simulation : les méthodes en boucle ouverte, dans lesquelles les résultats (c'est-à-dire les actions ou les réponses des véhicules simulés) n'affectent pas les données d'entrée futures, et les méthodes en boucle fermée, dans lesquelles les résultats influencent les entrées ultérieures, produisant un cycle adaptatif. .

Les techniques de simulation en boucle ouverte sont généralement plus faciles à mettre en œuvre, mais elles ne s'adaptent pas aux changements ou aux erreurs commises par les modèles testés en simulation. En revanche, les méthodes en boucle fermée reflètent mieux les paramètres dynamiques du monde réel et peuvent ainsi évaluer les performances des systèmes avec une plus grande précision, mais elles sont également plus exigeantes en termes de calcul et ne restituent pas toujours les manœuvres complexes et les nouvelles trajectoires des véhicules.

Des chercheurs de GigaAI, de l'Université de Pékin, de Li Auto Inc. et de CASIA ont récemment développé une nouvelle méthode qui pourrait améliorer la reconstruction des scènes de conduite dans les simulations. Cette méthode, décrite dans un article publié sur le arXiv serveur de préimpression, fonctionne essentiellement en intégrant progressivement les connaissances des modèles mondiaux de conduite autonome dans une scène.

« La simulation en boucle fermée est cruciale pour la conduite autonome de bout en bout », ont écrit Chaojun Ni, Guaosheng Zhao et leurs collègues dans leur article. « Les méthodes de simulation de capteurs existantes (par exemple NeRF et 3DGS) reconstruisent des scènes de conduite en fonction de conditions qui reflètent étroitement la distribution des données d'entraînement. Cependant, ces méthodes ont du mal à restituer de nouvelles trajectoires, telles que les changements de voie. »

Des études récentes axées sur le rendu de scènes de conduite pour entraîner et tester des modèles ont révélé que l'intégration des connaissances des modèles mondiaux peut améliorer le rendu de nouvelles trajectoires. Même si certaines approches intégrant des modèles mondiaux ont obtenu des résultats prometteurs, elles ont souvent échoué à produire des représentations précises de manœuvres particulièrement complexes, telles que les changements de vitesse sur plusieurs voies.

L'objectif principal de l'étude de Chaojun, Ni et de leurs collègues était de développer une nouvelle méthode susceptible d'améliorer le rendu de ces manœuvres. Les solutions proposées, appelées ReconDreamer et Drive Restorer, impliquent la formation de modèles mondiaux pour atténuer progressivement les effets indésirables dans le rendu des manœuvres de conduite complexes.

« Nous introduisons ReconDreamer, qui améliore la reconstruction des scènes de conduite grâce à l'intégration progressive des connaissances du modèle mondial », ont écrit Ni, Zhao et leurs collègues. « Plus précisément, DriveRestorer est proposé pour atténuer les artefacts via la restauration en ligne. Ceci est complété par une stratégie de mise à jour progressive des données conçue pour garantir un rendu de haute qualité pour des manœuvres plus complexes. »

Les chercheurs ont déjà réalisé différents tests pour évaluer la capacité de leur méthode à produire des rendus améliorés des scènes de conduite. Leurs résultats étaient très prometteurs, car ReconDreamer s'est avéré améliorer la qualité des rendus montrant des manœuvres complexes, tout en améliorant également la cohérence spatio-temporelle des éléments d'une scène.

« Au meilleur de nos connaissances, ReconDreamer est la première méthode permettant de réaliser efficacement un rendu lors de grandes manœuvres », ont écrit les chercheurs. « Les résultats expérimentaux démontrent que ReconDreamer surpasse les Street Gaussians dans les domaines NTA-IoU, NTL-IoU et FID, avec des améliorations relatives de 24,87 %, 6,72 % et 29,97 %. De plus, ReconDreamer surpasse DriveDreamer4D avec PVG lors du rendu à grande manœuvre, comme vérifié. par une amélioration relative de 195,87 % de la métrique NTA-IoU et une analyse complète étude utilisateur. »

La nouvelle méthode de reconstruction de scènes de conduite introduite par cette équipe de chercheurs pourrait bientôt être utilisée pour améliorer la formation et l’évaluation de modèles informatiques pour la conduite autonome dans les simulations. En outre, cela pourrait inspirer le développement de techniques similaires pour améliorer le rendu de scènes complexes, notamment des scènes pouvant être utilisées pour évaluer des modèles destinés à la robotique et à d’autres applications.