Une nouvelle voie pour la reconnaissance d'objets

Une nouvelle voie pour la reconnaissance d'objets

La classification d'images est l'une des tâches les plus courantes de l'IA, où un système doit reconnaître un objet à partir d'une image donnée. Pourtant, la vraie vie nous oblige à reconnaître non pas un seul objet isolé, mais plutôt plusieurs objets apparaissant ensemble dans une image donnée.

Cette réalité soulève la question : quelle est la meilleure stratégie pour aborder la classification multi-objets ? L'approche courante consiste à détecter chaque objet individuellement, puis à les classer. Mais de nouvelles recherches remettent en question cette approche habituelle des tâches de classification multi-objets.

Dans un article publié aujourd'hui dans Physica A : Mécanique statistique et ses applicationsdes chercheurs de l'Université Bar-Ilan en Israël montrent comment la classification d'objets ensemble, via un processus connu sous le nom de classification multi-étiquettes (MLC), peut surpasser la classification courante basée sur la détection.

« La détection nécessite de reconnaître chaque objet individuellement, puis d'effectuer la classification sur chacun de ces objets individuellement », a déclaré le professeur Ido Kanter, du département de physique de Bar-Ilan et du centre de recherche multidisciplinaire sur le cerveau de Gonda (Goldschmied), qui a dirigé la recherche.

« Même en supposant une identification parfaite, le réseau devra classer correctement chaque objet indépendamment, alors qu'avec MLC, les combinaisons d'objets sont classées ensemble et non séparément. »

« Cette nouvelle méthode permet au réseau d'apprendre les corrélations entre les objets qui apparaissent ensemble, ce qui les rend plus reconnaissables », a déclaré le docteur. Ronit Gross, étudiante, un contributeur clé à cette recherche.

« L'apprentissage de combinaisons, plutôt que de simples objets, peut donner de meilleurs résultats lorsque le réseau doit reconnaître plusieurs objets. Cette nouvelle compréhension peut ouvrir la voie à une IA capable de mieux reconnaître les combinaisons d'objets dans une seule image. »

Ces résultats remettent en question la compréhension actuelle de la manière dont plusieurs objets sont reconnus et peuvent améliorer des applications réelles, telles que les véhicules autonomes qui nécessitent l'analyse de nombreux objets présentés ensemble à un moment donné.