Faire progresser l’informatique affective avec diverses méthodologies d’IA

L’informatique affective, un domaine axé sur la compréhension et l’émulation des émotions humaines, a connu des progrès significatifs grâce à l’apprentissage profond. Cependant, des chercheurs de l’Université technique de Munich préviennent qu’une dépendance excessive à l’apprentissage profond pourrait entraver les progrès en négligeant d’autres tendances émergentes en matière d’intelligence artificielle.

Leur revue, publiée le 16 septembre dans Informatique intelligentepréconise l'utilisation d'une variété de méthodologies d'IA pour relever les défis actuels de l'informatique affective.

L’informatique affective utilise divers signaux, tels que les expressions faciales, les signaux vocaux et linguistiques, ainsi que des signaux physiologiques et des capteurs portables pour analyser et synthétiser les effets. Bien que l’apprentissage profond ait considérablement amélioré des tâches telles que la reconnaissance des émotions grâce à des innovations en matière d’apprentissage par transfert, d’apprentissage auto-supervisé et d’architectures de transformation, il présente également des défis, notamment une mauvaise généralisation, des problèmes d’adaptabilité culturelle et un manque d’interprétabilité.

Pour remédier à ces limitations, les auteurs décrivent un cadre complet pour développer des agents incarnés capables d'interagir avec plusieurs utilisateurs dans de nombreux contextes différents. L'une des clés de cette vision est l'évaluation des objectifs, des états mentaux et des relations des utilisateurs dans le but de faciliter des interactions plus longues. Les auteurs recommandent d’intégrer les neuf composants suivants, qu’ils décrivent en détail, pour améliorer les interactions homme-agent :

Graphiques qui cartographient les relations et le contexte des utilisateurs.
Des capsules qui modélisent les hiérarchies pour comprendre les interactions affectives.
Moteurs neurosymboliques qui facilitent le raisonnement sur les interactions à l'aide de primitives affectives.
Symboles qui établissent des connaissances communes et des règles d'interaction.
Mode de réalisation qui permet un apprentissage collaboratif dans des environnements contraints.
Personnalisation qui adapte les interactions aux caractéristiques individuelles des utilisateurs.
IA générative qui crée des réponses selon plusieurs modalités.
Modèles causals qui différencient les causes et les effets pour un raisonnement d'ordre supérieur.
Des réseaux de neurones qui améliorent le déploiement de réseaux de neurones profonds dans des environnements aux ressources limitées.

Les auteurs décrivent également plusieurs réseaux neuronaux de nouvelle génération, des thèmes résurgents et de nouvelles frontières en informatique affective.

Les réseaux neuronaux de nouvelle génération vont au-delà des modèles traditionnels d’apprentissage profond pour remédier aux limites de la capture de structures de données complexes, des relations spatiales et de l’efficacité énergétique. Les réseaux de capsules améliorent les réseaux convolutifs en préservant les hiérarchies spatiales, améliorant ainsi la modélisation d'entités complexes, telles que les parties du corps humain, ce qui est essentiel dans les soins de santé et la reconnaissance des émotions.

L'apprentissage profond géométrique étend l'apprentissage profond aux structures non euclidiennes, permettant une meilleure compréhension des interactions de données complexes. Il a été particulièrement utile dans l’analyse des sentiments et du visage. Imitant le déclenchement des neurones biologiques basé sur un seuil, les réseaux de neurones à pointe offrent une alternative plus économe en énergie pour les applications en temps réel, ce qui les rend adaptés aux environnements aux ressources limitées.

Les concepts traditionnels de l’IA, adaptés aux nouveaux contextes, peuvent améliorer les applications informatiques affectives. Les systèmes neurosymboliques sont particulièrement prometteurs, combinant la reconnaissance de formes de l'apprentissage profond avec le raisonnement symbolique de l'IA traditionnelle pour améliorer l'explicabilité et la robustesse des modèles d'apprentissage profond.

À mesure que ces modèles entrent dans le monde réel, ils doivent se conformer aux normes sociales, améliorant ainsi leur capacité à interpréter les émotions à travers les cultures. La cognition incarnée poursuit cet objectif en situant les agents d’IA dans des contextes physiques ou simulés, favorisant les interactions naturelles. Grâce à l'apprentissage par renforcement, les agents incarnés peuvent atteindre une meilleure situation et une meilleure interactivité, ce qui est particulièrement bénéfique dans des domaines complexes tels que les soins de santé et l'éducation.

De plus, trois idées substantielles ont émergé en informatique affective ces dernières années : les modèles génératifs, la personnalisation et le raisonnement causal. Les progrès des modèles génératifs, en particulier les processus basés sur la diffusion, permettent à l’IA de produire des expressions émotionnelles contextuellement pertinentes sur divers médias, ouvrant ainsi la voie à des agents interactifs et incarnés.

Au-delà des modèles universels, la personnalisation adapte les réponses en fonction des caractéristiques personnalisées de l'utilisateur tout en préservant la confidentialité des données grâce à l'apprentissage fédéré. En intégrant le raisonnement causal, les systèmes informatiques affectifs peuvent non seulement associer mais également intervenir et contrefactualiser dans des contextes émotionnels, améliorant ainsi leur adaptabilité et leur transparence.

L’avenir de l’informatique affective pourrait dépendre de la combinaison de l’innovation et d’une variété de méthodologies d’IA. Aller au-delà d’une approche centrée sur l’apprentissage profond pourrait ouvrir la voie à des systèmes plus sophistiqués, plus sensibles à la culture et conçus de manière éthique. L’intégration de multiples approches promet un avenir dans lequel la technologie non seulement comprend mais enrichit également les émotions humaines, marquant un pas significatif vers une IA véritablement intelligente et empathique.