Un cadre d'apprentissage en profondeur et de contrôle prédictif de modèles pour contrôler les quadrirotors et les robots agiles

Un cadre d’apprentissage en profondeur et de contrôle prédictif de modèles pour contrôler les quadrirotors et les robots agiles

Le Neural MPC en temps réel peut, par exemple, être utilisé pour modéliser efficacement des effets de sol aérodynamiques très complexes se produisant lors d’un vol à proximité d’obstacles (tableau), en utilisant uniquement le calcul embarqué. Crédit : Salzmann et al

Ces dernières années, les informaticiens ont développé des algorithmes de plus en plus avancés pour contrôler les mouvements des agents robotiques. Il s’agit notamment des techniques de contrôle prédictif du modèle (MPC), qui utilisent un modèle de la dynamique de l’agent pour optimiser son comportement futur vers un objectif donné tout en satisfaisant simultanément un certain nombre de contraintes (par exemple, ne pas se heurter à des obstacles).

Des chercheurs de l’Université technique de Munich et de l’Université de Zürich ont récemment créé le Real-time Neural MPC, un cadre qui intègre des architectures de modèles complexes basées sur des réseaux de neurones artificiels (ANN) dans un cadre MPC pour les robots agiles (c’est-à-dire des quadrirotors, des drones à quatre rotors) . Ce concept, présenté dans Lettres IEEE sur la robotique et l’automatisations’appuie sur une approche antérieure développée par le groupe de robotique et de perception de l’Université de Zurich.

« Nous avons croisé l’excellent travail par le groupe de robotique et de perception dirigé par Davide Scaramuzza, et ont été immédiatement captivés par l’idée de base d’avoir des composants basés sur les données (appris) stimulant les algorithmes de contrôle « traditionnels »,  » Tim Salzmann et Markus Ryll, chercheurs au Autonomous Aerial Systems Groupe de l’Université technique de Munich, a déclaré Tech Xplore.

« Après avoir élaboré une preuve de concept pour généraliser leur approche, qui utilise des processus gaussiens (GP), aux réseaux de neurones génériques (modèles d’apprentissage en profondeur), nous avons présenté notre idée au groupe de robotique et de perception de l’Université de Zurich. À partir de là, les travaux techniques et les expérimentations ont été avancés conjointement entre les deux laboratoires, déclenchant une nouvelle collaboration. »

Le nouveau cadre proposé par Salzmann, Ryll et leurs collègues combine des modèles d’apprentissage en profondeur et l’optimisation en ligne de MPC. Les modèles expressifs d’apprentissage en profondeur sont lourds en termes de calcul. Cependant, en les rapprochant en ligne en temps réel, le framework peut tirer parti du matériel dédié (GPU) pour traiter efficacement ces modèles, permettant à leur système de prédire les actions optimales des robots en temps réel.

« Le cadre MPC neuronal en temps réel permet de combiner deux domaines, un contrôle optimal et un apprentissage en profondeur tout en permettant aux deux parties de tirer parti de leurs cadres et dispositifs de calcul hautement optimisés respectifs », ont expliqué Salzmann et Ryll. « En tant que tel, nous pouvons effectuer des calculs d’apprentissage en profondeur dans PyTorch/Tensorflow sur un GPU tandis que l’optimisation du contrôle est effectuée dans du code C compilé sur un processeur. Cela permet d’utiliser la puissance de l’apprentissage en profondeur dans des applications auparavant irréalisables, par exemple dans le contrôle optimal embarqué. d’un quadrirotor. »

Les chercheurs évaluent leur cadre dans une série d’expériences, à la fois dans un environnement simulé et réel. Dans ces tests, ils l’utilisent spécifiquement pour contrôler les actions d’un quadrirotor très agile en temps réel.

Leurs résultats sont très prometteurs, car ils peuvent tirer parti de la puissance prédictive des architectures de réseaux de neurones avec une capacité paramétrique plus de 4 000 fois supérieure à celles précédemment utilisées pour contrôler les mouvements de robots agiles en temps réel. Ils constatent également que, par rapport aux méthodes MPC conventionnelles sans composant d’apprentissage en profondeur, leur cadre peut réduire les erreurs de suivi de position jusqu’à 82 %.

« En robotique, nous recherchons des modèles expressifs de la dynamique des systèmes contrôlés et de leur interaction avec l’environnement (par exemple, les effets aérodynamiques, le frottement des pneus, etc.) », ont déclaré Salzmann et Ryll. « Bien qu’il soit souvent difficile de les formuler analytiquement, les approches basées sur l’apprentissage, en particulier les réseaux de neurones, peuvent capturer les effets de dynamique et d’interaction. Cependant, la précision du modèle évolue avec la taille du réseau de neurones. Le MPC neuronal en temps réel permet l’utilisation de modèles d’apprentissage beaucoup plus puissants et performants par rapport à ce qui était auparavant possible dans Model Predictive Control. »

Comme l’a démontré la plate-forme Nvidia Jetson récemment publiée, les puces GPU trouvent progressivement leur place dans les systèmes embarqués. Le cadre créé par cette équipe de chercheurs pourrait bientôt permettre aux développeurs de tirer parti du haut pouvoir prédictif des techniques avancées d’IA basées sur les données pour mieux modéliser la dynamique des robots intégrant des puces GPU et leurs interactions avec l’environnement, réduisant ainsi le risque d’accidents et améliorant leur capacités de navigation.

« Il existe de nombreuses voies ouvertes pour de futures recherches », ont ajouté Salzmann et Ryll. « L’un des problèmes des approches d’apprentissage en profondeur est que leur sortie peut être erratique pour des situations qui ne font pas partie des données d’entraînement (Out Of Distribution OOD). Détecter ces situations et fournir une solution de repli pour que le contrôle stabilise le système conduirait à la robustesse dans Situations OOD. »