Un modèle de suivi de voiture basé sur l'apprentissage par renforcement pourrait réduire la consommation de carburant
Le secteur des transports reste l’une des principales sources de pollution atmosphérique et de changement climatique sur Terre, représentant environ 59 % de la consommation de pétrole et 22 % des émissions de CO2 L’identification de stratégies efficaces pour limiter la consommation de carburant des véhicules pourrait ainsi contribuer à réduire la pollution tout en s’attaquant aux pénuries énergétiques mondiales.
Des chercheurs de l’Université des sciences et technologies de Hong Kong ont récemment entrepris de relever ce défi en utilisant un modèle de calcul basé sur l’apprentissage par renforcement.
Ce modèle, décrit dans un article publié sur le serveur de pré-impression arXivest conçu pour optimiser la consommation de carburant dans les scénarios de suivi de voiture, en particulier dans les situations où des véhicules semi-automatisés et autonomes circulent à proximité et doivent maintenir une distance de sécurité les uns par rapport aux autres en ajustant leur vitesse.
« L'idée de ce rapport est née de la demande croissante de solutions de transport durables et économes en énergie », a déclaré Hui Zhong, co-auteur de l'étude, à Tech Xplore. « Les embouteillages et les comportements de conduite inefficaces contribuant de manière significative à la consommation de carburant et aux émissions, nous avons cherché à trouver des moyens d'atténuer ces défis. »
L’objectif principal de ces travaux récents de Zhong et de ses collègues était de développer un modèle informatique qui optimiserait la consommation de carburant dans les scénarios de suivi de voiture, tout en garantissant que les voitures maintiennent une distance de sécurité les unes par rapport aux autres et que le trafic s’écoule efficacement. Le modèle qu’ils ont développé, baptisé EcoFollower, est basé sur l’apprentissage par renforcement profond.
« EcoFollower est un modèle de suivi de voiture basé sur l'apprentissage par renforcement, conçu pour optimiser la consommation de carburant pendant la conduite », explique Zhong. « Le modèle apprend en permanence de son environnement, en ajustant les distances de suivi et les schémas d'accélération pour obtenir le comportement de conduite le plus économe en carburant. Ce qui distingue EcoFollower, c'est sa capacité à équilibrer l'efficacité énergétique avec le maintien d'une circulation fluide et sûre. »
Les modèles classiques destinés à optimiser le fonctionnement des véhicules dans les scénarios de suivi de véhicules se concentrent généralement uniquement sur la sécurité ou visent à faciliter la circulation. Le modèle EcoFollower, en revanche, est conçu pour réduire également la consommation de carburant.
Les chercheurs ont évalué leur modèle dans le cadre d'une série de tests où ils l'ont appliqué à l'ensemble de données Next Generation Simulation (NGSIM). Il s'agit d'une collection open source de données de trafic collectées à quatre endroits différents. Les résultats des premiers tests de l'équipe se sont révélés très prometteurs, car EcoFollower s'est avéré réduire considérablement la consommation de carburant dans tous les scénarios sur lesquels il a été testé.
« Nous avons démontré que l'apprentissage par renforcement peut être appliqué efficacement à des scénarios de conduite réels pour réduire la consommation de carburant », a déclaré Zhong. « Nos expériences ont montré qu'EcoFollower pouvait réduire la consommation de carburant de 10,42 % par rapport aux scénarios de conduite réels. Ce résultat a des implications importantes pour la réduction des émissions globales et la promotion du transport durable. »
À l’avenir, le modèle EcoFollower pourrait être intégré dans des systèmes avancés d’aide à la conduite (ADAS) et des systèmes de conduite autonome, contribuant ainsi à accroître leur efficacité et à réduire leur impact environnemental. En attendant, les chercheurs prévoient de continuer à travailler sur le modèle pour améliorer encore ses performances.
« Bien que ses performances soient déjà supérieures à celles du mode de conduite intelligent (IDM) traditionnel et qu'il réduise la consommation de carburant de 10,42 % par rapport aux scénarios de conduite réels, davantage de scénarios et d'ensembles de données sont nécessaires pour tester davantage et améliorer sa généralisation et sa robustesse », a ajouté Zhong. « Par exemple, dans un environnement de circulation à autonomie mixte, le comportement des véhicules conduits par des humains diffère de celui des véhicules autonomes, ce qui pourrait avoir un impact sur les performances du modèle. »