L'algorithme affine les traits du visage pour une meilleure détection des émotions

L'algorithme affine les traits du visage pour une meilleure détection des émotions

De nouvelles recherches présentent une méthode permettant d'améliorer la précision et la rapidité de la reconnaissance dynamique des émotions à l'aide d'un réseau neuronal convolutionnel (CNN) pour analyser les visages. Les travaux entrepris par Lanbo Xu de l'Université Northeastern de Shenyang, en Chine, pourraient avoir des applications dans les domaines de la santé mentale, de l'interaction homme-machine, de la sécurité et d'autres domaines.

L'ouvrage est publié dans le Journal international de biométrie.

Les expressions faciales jouent un rôle majeur dans la communication non verbale et fournissent des indices sur l'état émotionnel d'un individu. Jusqu'à présent, les systèmes de reconnaissance des émotions utilisaient des images statiques, ce qui signifie qu'ils ne pouvaient pas capturer la nature changeante des émotions qui se manifestent sur le visage d'une personne au cours d'une conversation, d'un entretien ou d'une autre interaction. Le travail de Xu aborde ce problème en se concentrant sur des séquences vidéo. Le système peut suivre l'évolution des expressions faciales sur une série d'images vidéo et offrir ensuite une analyse détaillée de la manière dont les émotions d'une personne se manifestent en temps réel.

Cependant, avant l'analyse, le système applique un algorithme, l'algorithme « Chaotic Frog Leap », pour affiner les principaux traits du visage. L'algorithme imite le comportement de recherche de nourriture des grenouilles pour trouver les paramètres optimaux dans les images numériques. Le CNN formé sur un ensemble de données d'expressions humaines est la partie la plus importante de l'approche, permettant à Xu de traiter les données visuelles en reconnaissant des motifs dans de nouvelles images qui se croisent avec les données d'entraînement. En analysant plusieurs images de séquences vidéo, le système peut capturer les mouvements de la bouche, des yeux et des sourcils, qui sont souvent des indicateurs subtils mais importants de changements émotionnels.

Xu fait état d'une précision allant jusqu'à 99 %, le système fournissant un résultat en une fraction de seconde. Une telle précision et une telle rapidité sont idéales pour une utilisation en temps réel dans divers domaines où la détection des émotions peut être utile sans nécessiter d'évaluation subjective par une autre personne ou équipe. Ses applications potentielles résident dans l'amélioration de l'expérience utilisateur avec des interactions informatiques où l'ordinateur peut répondre de manière appropriée à l'état émotionnel de l'utilisateur, comme la frustration, la colère ou l'ennui.

Le système pourrait être utile pour dépister les troubles émotionnels chez les personnes sans intervention humaine initiale. Il pourrait également être utilisé pour améliorer les systèmes de sécurité, en autorisant l'accès aux ressources, mais uniquement à ceux qui se trouvent dans un état émotionnel particulier et en interdisant l'entrée à une personne en colère ou bouleversée, par exemple. Le même système pourrait même être utilisé pour identifier la fatigue du conducteur dans les systèmes de transport ou même dans son propre véhicule. Les secteurs du divertissement et du marketing pourraient également voir des applications où la compréhension des réponses émotionnelles pourrait améliorer le développement de contenu, la diffusion et l'engagement des consommateurs.