Utiliser la géométrie pour détecter le danger dans les environnements d'IA

Utiliser la géométrie pour détecter le danger dans les environnements d'IA

L'espace-temps est un modèle conceptuel qui fusionne les trois dimensions de l'espace (longueur, largeur et largeur) avec la quatrième dimension du temps. Ce faisant, un objet géométrique à quatre dimensions est créé. Les chercheurs ont récemment utilisé une façon de penser similaire pour étudier les environnements d’IA, conduisant à un recadrage unique des problèmes d’IA en termes géométriques.

Dr Thomas Burns, titulaire d'un doctorat. diplômé et chercheur invité à l'Institut des sciences et technologies d'Okinawa (OIST), et le Dr Robert Tang, mathématicien à l'Université Xi'an Jiaotong-Liverpool et ancien chercheur postdoctoral à l'OIST, souhaitaient étudier les systèmes d'IA à partir d'un point de vue géométrique. perspective pour représenter plus précisément leurs propriétés.

Ils ont déterminé que l’apparition d’un « défaut géométrique », une défaillance de ce que l’on appelle la condition de liaison de Gromov, correspond exactement à l’endroit où il existe un potentiel de collision entre des agents d’IA en mouvement. Leurs conclusions ont été publiées dans la revue Transactions sur la recherche sur l'apprentissage automatique.

Modélisation de scénarios du monde réel avec des mondes en grille

Un monde quadrillé est constitué de cellules carrées disposées en grille, où les cellules peuvent être occupées ou non par un seul agent, comme un koala, ou par un objet, comme un ballon de plage. Les agents d'un monde quadrillé peuvent être programmés pour résoudre des énigmes et rechercher des récompenses. Ils peuvent se déplacer entre des tuiles adjacentes dans la grille, et les chercheurs étudient souvent leurs mouvements, leur planification et leurs stratégies lorsqu'ils sont chargés d'objectifs spécifiques, comme atteindre un emplacement précis dans le monde de la grille.

Les Gridworlds sont utilisés depuis longtemps dans la recherche sur l'IA, en particulier dans l'apprentissage par renforcement, qui a été utilisé pour battre les champions du monde des jeux vidéo et des jeux de société tels que les échecs et le Go. Ils fournissent des modèles simples mais évolutifs pour des applications potentielles dans le monde réel, par exemple pour coordonner en toute sécurité les mouvements de voitures autonomes ou de robots d'entrepôt.

À partir d'un état choisi dans le monde en grille (une disposition spécifiée du ou des agents et des objets), deux actions étaient autorisées : Déplacer – permettre à un agent de se déplacer vers une cellule vide adjacente, et Pousser/Tirer – permettre à un agent de pousser ou tirez un objet en ligne droite.

Lorsque ce processus est répété suffisamment de fois, un « complexe d’États » peut être créé. Les complexes d'états représentent toutes les configurations possibles d'un système en tant qu'objet géométrique unique, ce qui signifie que nous pouvons les étudier à l'aide d'outils mathématiques de géométrie (concernant la forme précise des objets), de topologie (propriétés des espaces préservées sous déformations, telles que flexion, étirement, et rétrécissement) et la combinatoire (compte et arrangements d'objets).

Les chercheurs ont utilisé une combinaison de mathématiques sur papier et stylo et d’un programme informatique sur mesure pour créer et analyser les complexes d’État créés dans cette étude.

« C'est comme un jeu d'arcade rétro, mais vous pouvez ajouter toutes sortes de choses, comme des portes, des boutons et des ennemis, puis réfléchir à la géométrie et à la topologie de n'importe lequel de ces scénarios plus compliqués », a expliqué le Dr Burns. « Vous pouvez intuitivement considérer le complexe d'états comme un ensemble physique de Lego avec des cubes, des carrés et des bâtons collés ensemble, chacun représentant des reconfigurations spécifiques du monde quadrillé. »

Entrez dans le monde du quadrillage : utiliser la géométrie pour détecter les dangers dans les environnements d'IA

Le moment avant la collision

Lorsque deux agents se rapprochent trop, ils risquent de se heurter. Il s’avère que ce crash potentiel indique un défaut géométrique, et chaque fois que cela se produit dans un monde quadrillé, il pourrait potentiellement y avoir une collision.

Il est intéressant de noter que la plupart du temps, les mathématiciens visent à prouver qu’un objet comme celui-ci ne présente aucun défaut géométrique. En effet, c’est l’absence de ces défauts qui confère à l’objet les propriétés mathématiques souhaitables. Si ne serait-ce qu’un seul défaut géométrique est présent, alors l’ensemble du complexe étatique perd ces avantages.

« Au départ, nous voulions montrer qu'il n'y avait pas de défauts géométriques, mais ensuite nous avons trouvé des tas de ces petits désagréments, et nous avons pensé que ce n'était peut-être pas si gênant, peut-être que cela était en corrélation avec quelque chose d'important. Il s'avère que oui, c'est… c'est lié à ces informations clés en matière de sécurité », a déclaré le Dr Burns.

Les scientifiques ont également prouvé que ces défauts géométriques se produisent dans le complexe d'états lorsque deux agents sont séparés par un mouvement de chevalier ou un mouvement de fou en deux temps aux échecs. « Ce sont les seuls cas où ces défauts se produisent. Par exemple, dans le monde réel, des robots pourraient potentiellement se heurter dans un entrepôt, ou des voitures autonomes pourraient entrer en collision à une intersection. Ce n'est pas le point de collision, c'est le moment qui précède la collision qui est importante.

Applications pratiques pour l'IA

Les défauts géométriques et les méthodes géométriques en général peuvent contribuer à améliorer notre compréhension des systèmes d’IA existants. Par exemple, les chercheurs pourraient utiliser un système d’IA entraîné pour éviter les collisions entre agents et tenter de découvrir où se situent ces défauts géométriques. Cela pourrait aider les scientifiques à détecter plus efficacement les collisions potentielles dans les systèmes d’IA, tels que les scénarios de vie assistée dans lesquels les robots et les humains interagissent fréquemment.

« Ces résultats fournissent une nouvelle méthode pour rechercher des limites de sécurité garanties dans les environnements d'IA avec plusieurs agents – et il n'est pas nécessaire qu'ils soient des koalas ; il peut s'agir de robots aidant aux tâches domestiques, explorant les zones sinistrées ou de véhicules autonomes pour les services de livraison », » a noté le Dr Burns.