Les copilotes d’IA prêts à engager l’avenir du combat aérien

Les copilotes d’IA prêts à engager l’avenir du combat aérien

L’avenir des conflits militaires est indissociable du développement de l’intelligence artificielle (IA). Le champ de bataille du futur sera redéfini par la mise en œuvre de systèmes autonomes intelligents fonctionnant à la vitesse et avec la précision d’une machine. Comme l’a déclaré sans ambages la Commission nationale de sécurité sur l’intelligence artificielle dans son rapport final de 2021 : « Se défendre contre des adversaires capables d’IA fonctionnant à la vitesse d’une machine sans recourir à l’IA est une invitation au désastre. »

« Nous devons garder les combattants humains aux commandes de la bataille future, et cela signifie investir dans des efforts visant à catalyser la prise de décision humaine grâce à la puissance de calcul avancée de l'IA », a déclaré Tom Urban, qui supervise le groupe des plates-formes de combat intelligentes à l'Université Johns Hopkins. Laboratoire de physique appliquée (APL) à Laurel, Maryland. « APL participe à un certain nombre d'efforts pour y parvenir en fournissant aux humains des assistants virtuels intelligents. »

S'appuyant sur plus d'une décennie passée à repousser les limites de ce que l'IA peut faire dans le combat aérien, les ingénieurs et spécialistes du combat aérien de l'APL ont réalisé des progrès significatifs dans la création d'un copilote qui accordera la puissance, la vitesse et la précision du calcul de la machine aux pilotes de chasse humains.

Un ailier du logiciel

La plupart des travaux dans ce domaine, comme le XQ-58A Valkyrie, l'avion expérimental sans pilote de l'armée de l'air, se concentrent sur la création d'avions de combat autonomes avancés.

Les chercheurs de l’APL ont cependant pour objectif d’augmenter la prise de décision humaine grâce à la puissance de calcul de l’IA. Plutôt que de chercher à remplacer les pilotes, les chercheurs de l’APL visent à les aider à réussir en améliorant et en complétant leurs capacités, leur intuition et leur expérience par la vitesse et la précision des machines.

À cette fin, l’équipe a créé, après trois années de développement minutieux, un coéquipier IA baptisé VIPR. Abréviation de Virtual Intelligent Peer-Reasoning Agent, VIPR sert un pilote dans trois fonctions critiques : en tant que pair conscient de la situation, ailier performant et assistant de soutien cognitif.

John Winder, informaticien du secteur de projection de force de l'APL qui co-dirige le projet avec Urban, compare VIPR à R2-D2, le droïde d'assistance au pilotage de « Star Wars ».

« Il peut rester en retrait et fournir un soutien en maintenant une conscience de la situation, en surveillant les angles morts et en alertant le pilote en cas de besoin, ou il peut intervenir et jouer le rôle du pilote, piloter l'avion et prendre des mesures pour sauver la vie de son pilote humain. , » il a dit.

Suivi des angles morts cognitifs

Une autre façon de considérer VIPR est de le considérer comme un assistant GPS et de navigation extrêmement avancé, là pour aider le conducteur à surmonter les angles morts. Mais là où les angles morts du conducteur sont visuels, ceux du pilote de chasse sont avant tout cognitifs.

« Les pilotes de chasse sont, par nature, des gens très confiants », a déclaré Winder. « C'est une nécessité professionnelle et un atout, mais cela peut aussi conduire à une sorte de vision tunnel qui pourrait les empêcher d'assimiler de nouvelles informations cruciales dans le feu du combat. »

L’une des fonctions les plus importantes du VIPR est donc de suivre activement l’état cognitif du pilote. Il doit comprendre les intentions du pilote, savoir ce que le pilote sait et raisonner sur ce qu'il comprend, afin de reconnaître quand l'IA et le pilote ne sont plus sur la même longueur d'onde.

« En plus de regarder vers l'extérieur pour suivre et prédire les menaces adverses, VIPR doit également regarder vers l'intérieur pour comprendre les intentions, les objectifs et les modes de comportement du pilote humain, le tout seconde par seconde », a déclaré Winder. « Et lorsque le pilote a manqué quelque chose de critique pendant le combat, VIPR doit l'en informer en temps opportun et de manière concrète pour l'aider à survivre à l'engagement. »

Le prototype VIPR est capable de faire tout cela dans une simulation interactive en temps réel, en répondant aux commandes vocales du pilote, en alternant les rôles entre pilote complet et copilote de manière fluide et transparente. Et comme si cela ne suffisait pas, il peut également piloter plusieurs véhicules autonomes. des coéquipiers ou des avions de combat collaboratifs. Dans ce mode, le pilote humain peut agir comme le quarterback d'une équipe de football, dirigeant les objectifs d'une équipe contrôlée par VIPR.

Après trois années de développement, l’équipe APL se prépare à évaluer plus formellement son prototype d’IA avec des pilotes humains. Mais de manière anecdotique, la réponse initiale a été prometteuse.

« Nous avons quelques anciens pilotes dans notre équipe, et ils ont tous quitté la simulation avec le sourire aux lèvres », a déclaré Winder. « Et en tant que non-pilote moi-même, lorsque je m'engage dans le scénario de simulation sans aide, je survis pendant peut-être huit secondes. Avec VIPR, je suis capable de survivre et de gagner.

« De toute évidence, nous avons des tests beaucoup plus rigoureux à effectuer avant que cela puisse être mis en service, mais nous sommes optimistes sur la base de ce que nous avons vu jusqu'à présent. »

Nouveaux défis, nouvelles technologies

Le développement de VIPR a nécessité un effort concerté de la part des scientifiques et ingénieurs de l’APL, nécessitant plusieurs percées majeures dans les techniques d’IA et d’apprentissage automatique.

Trois avancées particulièrement significatives sont cruciales pour comprendre ce qui rend VIPR unique.

La première a été la création d’auto-encodeurs variationnels conditionnels récurrents (RCVAE), essentiellement des modèles d’apprentissage automatique capables d’encoder les observations, les croyances et les décisions (souvent implicites) d’un pilote humain. Les RCVAE sont multimodaux et probabilistes, ce qui signifie qu'ils doivent déduire et intégrer plusieurs variables provenant de diverses sources de données et prendre des décisions basées sur des approximations intelligentes, le tout à une vitesse fulgurante.

Cette percée est ce qui permet à VIPR de développer quelque chose qui ressemble à une compréhension « intuitive » structurée des intentions et des croyances du pilote.

La seconde consistait à appliquer les réseaux de neurones graphiques (GNN) au problème de la modélisation du comportement de l'adversaire. Les GNN sont un type de réseau neuronal qui peut être directement appliqué aux graphiques pour prédire les états futurs de tout ce qui peut être représenté sur un graphique, de la même manière qu'un grand modèle de langage peut être utilisé pour prédire et générer du texte.

L’application des GNN permet à VIPR de prédire les comportements complexes d’adversaires et les manœuvres coordonnées avec une haute fidélité dans un espace 3D.

Notamment, ces deux premières avancées ont une applicabilité générale au-delà du problème spatial du combat aérien et sont déjà exploitées pour d’autres efforts en matière d’APL.

Le troisième facteur essentiel a été le développement d'un nouveau réseau neuronal avancé connu sous le nom de réseau d'attention état-temps (STAN) pour un apprentissage approfondi par renforcement multi-agents.

Basé sur la même architecture Transformer utilisée par ChatGPT (GPT signifie « transformateur pré-entraîné génératif ») et de nombreux autres outils d'IA générative, STAN permet à VIPR d'étendre sa « sensibilisation » à un nombre variable d'entités et d'apprendre une plus grande variété de multi- comportements liés aux tâches.

« Les réseaux de neurones supposent généralement une entrée de taille fixe et ne peuvent pas gérer un ensemble de variables observées qui changent dynamiquement. Avec STAN, VIPR peut s'adapter rapidement à de nouveaux scénarios qu'il n'a jamais vus auparavant et basculer en douceur entre plusieurs tâches. STAN est un nouvelle contribution de l'APL, et qui est vraiment nécessaire pour faire progresser l'état de l'art dans le domaine de la prise de décision en matière d'IA », a déclaré Winder.

Une histoire de repousser les limites

VIPR – et l’effort plus vaste qui l’a produit, connu sous le nom de Beyond Human Reasoning – est la dernière d’une longue lignée d’innovations APL en matière d’IA pour le combat aérien, remontant à plus d’une décennie.

Cette histoire inclut le rôle de responsable technique et d'hôte des essais AlphaDogfight, au cours desquels des agents d'IA se sont affrontés avec des pilotes humains de F-16 ; construire le Colisée, un environnement virtuel pour soutenir le programme Golden Horde du Laboratoire de recherche de l'Armée de l'Air visant à créer la prochaine génération de systèmes d'armes autonomes ; et soutenir le programme Air Combat Evolution de la Defense Advanced Research Projects Agency en développant des infrastructures et des solutions autonomes pour permettre aux agents d'IA de contrôler un avion de combat à grande échelle.

Plus largement, APL est engagé dans un certain nombre d’efforts visant à promouvoir un travail d’équipe et une collaboration fluides avec des systèmes basés sur l’IA à tous les niveaux de la bataille, depuis les soldats individuels jusqu’aux commandants et décideurs du champ de bataille.

Ce travail a été rendu possible en partie grâce au programme Innovation d'APL, et en particulier au Projet Catalyst, une initiative qui permet aux membres du personnel de concourir pour un financement important, parfois sur plusieurs années, afin de tester des hypothèses critiques, d'étudier des phénomènes et de repousser les limites de notre connaissances actuelles.