Les véhicules formés à l'IA peuvent s'adapter à des turbulences extrêmes à la volée
Dans la nature, les animaux volants sentent les changements imminents dans leur environnement, y compris l’apparition de turbulences soudaines, et s’adaptent rapidement pour rester en sécurité. Les ingénieurs qui conçoivent des avions aimeraient donner à leurs véhicules la même capacité à prédire les perturbations entrantes et à y réagir de manière appropriée.
En effet, des catastrophes telles que le vol mortel de Singapore Airlines en mai dernier, au cours duquel plus de 100 passagers ont été blessés après que l'avion a rencontré de graves turbulences, pourraient être évitées si l'avion disposait de telles capacités de détection et de prédiction automatiques combinées à des mécanismes de stabilisation du véhicule.
Aujourd'hui, une équipe de chercheurs du Center for Autonomous Systems and Technologies (CAST) de Caltech et de Nvidia a franchi une étape importante vers de telles capacités. Dans un nouvel article de la revue npj robotiquel'équipe décrit une stratégie de contrôle qu'elle a développée pour les véhicules aériens sans pilote, ou UAV, appelée FALCON (Fourier Adaptive Learning and CONtrol).
La stratégie utilise l'apprentissage par renforcement, une forme d'intelligence artificielle, pour apprendre de manière adaptative comment les vents turbulents peuvent changer au fil du temps, puis utilise ces connaissances pour contrôler un drone en fonction de ce qu'il subit en temps réel.
« Les turbulences spontanées ont des conséquences majeures sur tout, depuis les vols civils jusqu'aux drones. Avec le changement climatique, les événements météorologiques extrêmes qui provoquent ce type de turbulences sont en augmentation », déclare Mory Gharib, professeur Hans W. Liepmann d'aéronautique et de génie médical, Booth-Kresa Leadership Chair de CAST et auteur du nouvel article.
« Des turbulences extrêmes apparaissent également à l'interface entre deux flux de cisaillement différents, par exemple lorsque des vents à grande vitesse rencontrent une stagnation autour d'un immeuble de grande hauteur. Par conséquent, les drones en milieu urbain doivent être capables de compenser de tels changements soudains. FALCON offre à ces véhicules un moyen de comprendre les turbulences à venir et de procéder aux ajustements nécessaires. »
FALCON n'est pas la première stratégie de contrôle de drone à utiliser l'apprentissage par renforcement. Cependant, les stratégies précédentes n’ont pas tenté d’apprendre le modèle sous-jacent qui représente véritablement le fonctionnement des vents turbulents. Au lieu de cela, elles ont toutes été des méthodes sans modèle. De telles méthodes se concentrent sur la maximisation d’une fonction de récompense qui ne peut pas être utilisée pour aborder différents paramètres, tels que différentes conditions de vent ou configurations de véhicules, sans recyclage, car elles se concentrent sur un seul environnement.
« Ce n'est pas si bon dans le monde physique, où nous savons que les situations peuvent changer de manière radicale et rapide », déclare Anima Anandkumar, professeur Bren d'informatique et de sciences mathématiques à Caltech et auteur du nouvel article. « Nous avons besoin que l'IA apprenne bien le modèle sous-jacent de turbulence afin qu'elle puisse agir en fonction de la façon dont elle pense que le vent va changer. »
« Les progrès de l'IA fondamentale changeront le visage de l'industrie aéronautique, en améliorant la sécurité, l'efficacité et les performances sur une gamme de plates-formes, notamment les avions de ligne, les drones et les avions de transport. Ces innovations promettent de rendre le transport aérien et les opérations plus intelligents, plus sûrs. et plus rationalisé », déclare Kamyar Azizzadenesheli, co-auteur de Nvidia.
Comme l'indique l'acronyme FALCON, la stratégie est basée sur les méthodes de Fourier, ce qui signifie qu'elle repose sur l'utilisation de sinusoïdes, ou d'ondes périodiques, pour représenter les signaux, ici les conditions de vent. Les vagues fournissent une bonne approximation des mouvements standards du vent, réduisant ainsi les calculs nécessaires au minimum. Au sein de ces vagues, lorsqu’une turbulence extrême apparaît, l’instabilité se manifeste par un changement notable de fréquence.
« Si vous pouvez apprendre à prédire ces fréquences, alors notre méthode peut vous donner une idée de ce qui vous attend », explique Gharib, qui est également directeur des Graduate Aerospace Laboratories de Caltech.
« Les méthodes de Fourier fonctionnent bien ici car les ondes turbulentes sont mieux modélisées en termes de fréquences, la majeure partie de leur énergie se trouvant dans les basses fréquences », explique le co-auteur principal Sahin Lale, aujourd'hui ingénieur de recherche senior chez Neural Propulsion Systems, Inc. qui a terminé le travail à Caltech. « L'utilisation de ces connaissances préalables simplifie à la fois l'apprentissage et le contrôle des dynamiques turbulentes, même avec une quantité limitée d'informations. »
Pour tester l'efficacité de la stratégie FALCON, les chercheurs ont créé une configuration de test extrêmement difficile dans la soufflerie John W. Lucas à Caltech. Ils ont utilisé un système d'aile à voilure entièrement équipé comme drone représentatif, l'équipant de capteurs de pression et de surfaces de contrôle capables d'effectuer des ajustements en ligne sur des éléments tels que l'altitude et le lacet du système. Ils ont ensuite positionné un grand cylindre doté d’un accessoire mobile dans la soufflerie. Lorsque le vent passait sur le cylindre, il créait des fluctuations aléatoires et importantes du vent atteignant le profil aérodynamique.
« La formation d'un algorithme d'apprentissage par renforcement dans un environnement physique turbulent présente toutes sortes de défis uniques », déclare Peter I. Renn, co-auteur principal de l'article et maintenant stratège quantitatif chez Virtu Financial. « Nous ne pouvions pas compter sur des signaux parfaitement clairs ni sur des simulations de flux simplifiées, et tout devait être fait en temps réel. »
Après environ neuf minutes d'apprentissage, le système assisté par FALCON a pu se stabiliser dans cet environnement extrême.
« À chaque nouvelle observation, le programme s'améliore car il contient plus d'informations », explique Anandkumar.
« L'avenir dépend vraiment de la puissance du logiciel, car il nécessitera de moins en moins de formation », explique Gharib. « Une adaptation rapide sera le défi, et nous allons pousser, pousser, pousser. »
En ce qui concerne l’avenir, il ajoute que les chercheurs envisagent de donner aux drones et même aux avions de passagers la possibilité de partager entre eux des informations détectées et apprises sur les conditions. Un tel partage entre avions des mesures des capteurs et de l’apprentissage basé sur l’intelligence artificielle, en particulier à proximité d’une perturbation, pourrait contribuer à assurer la sécurité des avions.
« Je crois que cela va arriver », déclare Gharib. « Sinon, les choses deviendront très dangereuses à mesure que les phénomènes météorologiques extrêmes augmenteront en fréquence. »