Des scientifiques révèlent les pensées cachées de l'IA
Les réseaux de neurones profonds sont un type d'intelligence artificielle (IA) qui imitent la façon dont le cerveau humain traite l'information, mais comprendre comment ces réseaux « pensent » constitue depuis longtemps un défi. Aujourd’hui, des chercheurs de l’Université de Kyushu ont développé une nouvelle méthode pour comprendre comment les réseaux neuronaux profonds interprètent les informations et les classent en groupes.
Publié dans Transactions IEEE sur les réseaux de neurones et les systèmes d'apprentissagel'étude répond au besoin important de garantir que les systèmes d'IA sont précis et robustes et peuvent répondre aux normes requises pour une utilisation sûre.
Les réseaux neuronaux profonds traitent les informations à plusieurs niveaux, de la même manière que les humains résolvent un casse-tête étape par étape. La première couche, appelée couche d’entrée, apporte les données brutes. Les couches suivantes, appelées couches cachées, analysent les informations. Les premières couches cachées se concentrent sur des fonctionnalités de base, telles que la détection des bords ou des textures, comme l'examen des pièces individuelles d'un puzzle.
Des couches cachées plus profondes combinent ces caractéristiques pour reconnaître des modèles plus complexes, tels que l'identification d'un chat ou d'un chien, de la même manière que l'on connecte des pièces de puzzle pour révéler une vue d'ensemble.
« Cependant, ces couches cachées sont comme une boîte noire verrouillée : nous voyons les entrées et les sorties, mais ce qui se passe à l'intérieur n'est pas clair », explique Danilo Vasconcellos Vargas, professeur agrégé à la Faculté des sciences de l'information et de génie électrique de l'Université de Kyushu.
« Ce manque de transparence devient un problème sérieux lorsque l'IA commet des erreurs, parfois déclenchées par quelque chose d'aussi petit que la modification d'un seul pixel. L'IA peut sembler intelligente, mais comprendre comment elle prend sa décision est essentiel pour garantir sa fiabilité. »
Actuellement, les méthodes permettant de visualiser la manière dont l’IA organise les informations reposent sur la simplification des données de grande dimension en représentations 2D ou 3D. Ces méthodes permettent aux chercheurs d'observer comment l'IA catégorise les points de données, par exemple en regroupant des images de chats proches d'autres chats tout en les séparant des chiens. Cependant, cette simplification comporte des limites critiques.
« Lorsque nous simplifions des informations de grande dimension en moins de dimensions, c'est comme si nous aplatissions un objet 3D en 2D : nous perdons des détails importants et ne parvenons pas à voir l'ensemble de l'image. De plus, cette méthode de visualisation de la façon dont les données sont regroupées rend difficile la comparaison entre les données. différents réseaux neuronaux ou classes de données », explique Vargas.
Dans cette étude, les chercheurs ont développé une nouvelle méthode, appelée méthode de distribution k*, qui visualise et évalue plus clairement dans quelle mesure les réseaux neuronaux profonds catégorisent les éléments associés.
Le modèle fonctionne en attribuant à chaque point de données saisi une « valeur k* » qui indique la distance jusqu'au point de données non lié le plus proche. Une valeur k* élevée signifie que le point de données est bien séparé (par exemple, un chat éloigné de tout chien), tandis qu'une valeur k* faible suggère un chevauchement potentiel (par exemple, un chien plus proche d'un chat que d'autres chats). Lorsque l'on examine tous les points de données d'une classe, comme les chats, cette approche produit une distribution de valeurs k* qui fournit une image détaillée de la façon dont les données sont organisées.
« Notre méthode conserve l'espace de dimension supérieure, donc aucune information n'est perdue. C'est le premier et le seul modèle capable de donner une vue précise du » voisinage local « autour de chaque point de données », souligne Vargas.
Grâce à leur méthode, les chercheurs ont révélé que les réseaux neuronaux profonds trient les données en arrangements groupés, fracturés ou qui se chevauchent. Dans un arrangement groupé, les éléments similaires (par exemple, les chats) sont regroupés étroitement, tandis que les éléments non liés (par exemple, les chiens) sont clairement séparés, ce qui signifie que l'IA est capable de bien trier les données.
Les arrangements fracturés indiquent cependant que des éléments similaires sont dispersés sur un vaste espace, tandis que des distributions qui se chevauchent se produisent lorsque des éléments non liés se trouvent dans le même espace, les deux arrangements rendant les erreurs de classification plus probables.
Vargas compare cela à un système d'entrepôt : « Dans un entrepôt bien organisé, les articles similaires sont stockés ensemble, ce qui rend la récupération facile et efficace. Si les articles sont mélangés, ils deviennent plus difficiles à trouver, ce qui augmente le risque de sélectionner le mauvais article. »
L’IA est de plus en plus utilisée dans des systèmes critiques comme les véhicules autonomes et les diagnostics médicaux, où la précision et la fiabilité sont essentielles. La méthode de distribution k* aide les chercheurs, et même les législateurs, à évaluer la manière dont l’IA organise et classe les informations, en identifiant les faiblesses ou les erreurs potentielles.
Cela soutient non seulement les processus de légalisation nécessaires pour intégrer l’IA dans la vie quotidienne en toute sécurité, mais offre également des informations précieuses sur la façon dont l’IA « pense ». En identifiant les causes profondes des erreurs, les chercheurs peuvent affiner les systèmes d’IA pour les rendre non seulement précis mais également robustes, capables de gérer des données floues ou incomplètes et de s’adapter à des conditions inattendues.
« Notre objectif ultime est de créer des systèmes d'IA qui maintiennent précision et fiabilité, même face aux défis des scénarios du monde réel », conclut Vargas.