Générer des réponses machine empathiques grâce au suivi des émotions et au guidage des contraintes
Permettre aux machines de communiquer comme les humains est un objectif à long terme de la génération de dialogues en domaine ouvert. Pour atteindre cet objectif, de plus en plus d’études sur la génération du dialogue se concentrent sur le facteur clé qu’est l’émotion. Le système de dialogue empathique vise à reconnaître l'émotion et la situation de l'utilisateur, puis génère des réponses en conséquence.
Un tel système de dialogue empathique peut améliorer l'expérience de l'utilisateur et établir une interaction homme-machine à long terme. Cependant, les modèles de génération de dialogue empathique existants ignorent la continuité de l'expression émotionnelle des parties dans les tours de dialogue adjacents, ce qui entraîne une perception émotionnelle inadéquate. En outre, les émotions impliquées dans la réponse empathique sont flexibles et il est difficile de définir une politique empathique spécifique.
Pour répondre à ces questions, une équipe de recherche dirigée par Donghong Han a publié ses recherches le 15 avril 2024 dans Frontières de l'informatique.
L'équipe a proposé un nouveau modèle de génération de dialogue empathique ETHREED, qui s'appuie sur des GRU hiérarchiques pour extraire et suivre séparément la représentation émotionnelle des deux parties dans les dialogues. De plus, le modèle prédit les représentations émotionnelles des réponses en utilisant le réseau de politiques stochastiques et la recherche guidée de politiques. Les résultats expérimentaux montrent que nos réponses sont plus diversifiées, empathiques et pertinentes.
Dans un dialogue, les émotions des parties ont tendance à être continues ou à évoluer vers le positif ou le négatif selon le contexte. Pour modéliser le processus continu de différentes parties, ETHREED utilise quatre GRU pour obtenir l'état global, l'état du parti, la représentation émotionnelle et la représentation du contenu dans les dialogues.
Le GRU global suit toutes les représentations d'énoncés pour obtenir des informations contextuelles. Le parti GRU modélise l’interaction des partis. L'émotion GRU suit respectivement les émotions des parties. Le GRU de contenu extrait la représentation du contenu du dialogue et atténue les erreurs de perception des émotions.
De plus, l'empathie peut être considérée comme le transfert d'émotion entre les parties, de sorte que la recherche définit le processus de prédiction de l'état émotionnel de l'auditeur en fonction de l'état émotionnel du locuteur comme étant la politique empathique. Un réseau de politiques stochastiques est utilisé pour modéliser ce processus. Nous utilisons la véritable distribution des émotions de l’auditeur comme contrainte pour guider la recherche politique.
Enfin, le réseau de génération de pointeurs intègre dynamiquement la représentation émotionnelle prédite de l’auditeur et les informations contextuelles à décoder.
Les travaux futurs peuvent envisager d'introduire le comportement de dialogue pour guider la génération de réponses et explorer des mesures d'évaluation plus raisonnables.
Fourni par Frontiers Journals