Méthode pour former l'IA avec des données de classification multilabel

La figure montre comment de nouvelles informations sont apprises chaque fois qu’une distribution de données est entrée, tout en conservant les informations apprises dans le passé. Crédit : Naoki Masuyama, Université métropolitaine d’Osaka

Les progrès de la technologie Internet des objets (IoT) nous ont permis d’obtenir facilement et en continu de grandes quantités de données diverses. La technologie de l’intelligence artificielle attire de plus en plus l’attention en tant qu’outil permettant d’utiliser ces mégadonnées.

L’apprentissage automatique conventionnel traite principalement des problèmes de classification à étiquette unique, dans lesquels les données et les phénomènes ou objets correspondants (informations d’étiquette) sont dans une relation un à un. Cependant, dans le monde réel, les données et les informations sur les étiquettes ont rarement une relation univoque.

Ces dernières années, par conséquent, l’attention s’est portée sur le problème de la classification multi-étiquettes, qui traite des données qui ont une relation un à plusieurs entre les données et les informations de l’étiquette. Par exemple, une seule photo de paysage peut inclure plusieurs étiquettes pour des éléments tels que le ciel, les montagnes et les nuages. De plus, pour apprendre efficacement à partir de données volumineuses obtenues en continu, la capacité d’apprendre au fil du temps sans détruire les choses apprises précédemment est également requise.

Un groupe de recherche dirigé par le professeur agrégé Naoki Masuyama et le professeur Yusuke Nojima de la Graduate School of Informatics de l’Université métropolitaine d’Osaka, a développé une nouvelle méthode qui combine les performances de classification des données avec plusieurs étiquettes, avec la capacité d’apprendre continuellement avec les données. Des expériences numériques sur des ensembles de données multi-étiquettes du monde réel ont montré que la méthode proposée surpasse les méthodes conventionnelles.

La simplicité de ce nouvel algorithme permet de concevoir facilement une version évoluée qui peut être intégrée à d’autres algorithmes. Étant donné que la méthode de clustering sous-jacente regroupe les données en fonction de la similitude entre les entrées de données, elle devrait être un outil utile pour le prétraitement continu des mégadonnées.

De plus, les informations d’étiquette attribuées à chaque cluster sont apprises en continu, en utilisant une méthode basée sur l’approche bayésienne. En apprenant les données et en apprenant les informations d’étiquette correspondant aux données séparément et en continu, on obtient à la fois des performances de classification élevées et une capacité d’apprentissage continu.

« Nous pensons que notre méthode est capable d’apprendre en continu à partir de données multi-étiquettes et possède les capacités requises pour l’intelligence artificielle dans une future société de mégadonnées », a conclu le professeur Masuyama.

Les résultats de la recherche ont été publiés dans Transactions IEEE sur l’analyse de modèles et l’intelligence artificielle le 19 décembre 2022.

Fourni par l’Université métropolitaine d’Osaka