Les algorithmes ne comprennent pas le sarcasme. Oui en effet!
Le sarcasme, un phénomène linguistique complexe que l’on retrouve souvent dans la communication en ligne, sert souvent de moyen d’exprimer des opinions ou des émotions profondément ancrées d’une manière particulière qui peut être dans un certain sens spirituelle, passive-agressive ou, le plus souvent, humiliante ou ridicule. la personne à qui on s’adresse. Reconnaître le sarcasme dans l’écrit est crucial pour comprendre la véritable intention derrière une déclaration donnée, en particulier lorsque nous prenons en compte les médias sociaux ou les avis de clients en ligne.
S’il est généralement assez facile de détecter que quelqu’un est sarcastique dans le monde hors ligne, compte tenu de l’expression du visage, du langage corporel et d’autres indicateurs, il est plus difficile de déchiffrer le sarcasme dans un texte en ligne. Nouvel ouvrage publié dans le Journal international de l’informatique sans fil et mobile espère relever ce défi. Geeta Abakash Sahu et Manoj Hudnurkar de l’Université internationale Symbiosis de Pune, en Inde, ont développé un modèle avancé de détection du sarcasme visant à identifier avec précision les remarques sarcastiques dans les conversations numériques, une tâche cruciale pour comprendre la véritable intention derrière les déclarations en ligne.
Le modèle de l’équipe comprend quatre phases principales. Cela commence par le prétraitement du texte, qui consiste à filtrer les mots courants, ou « bruit », tels que « le », « il » et « et ». Il décompose ensuite le texte en unités plus petites. Pour relever le défi consistant à gérer un grand nombre de fonctionnalités, l’équipe a utilisé des techniques de sélection de fonctionnalités optimales pour garantir l’efficacité du modèle en donnant la priorité uniquement aux fonctionnalités les plus pertinentes. Les caractéristiques indicatives du sarcasme, telles que le gain d’informations, le chi carré, les informations mutuelles et l’incertitude symétrique, sont ensuite extraites de ces données prétraitées par l’algorithme.
Pour la détection des sarcasmes, l’équipe a utilisé un classificateur d’ensemble comprenant divers algorithmes, notamment des réseaux de neurones (NN), des forêts aléatoires (RF), des machines à vecteurs de support (SVM) et un réseau de neurones à convolution profonde (DCNN). Les performances de ce dernier ont été optimisées à l’aide d’un algorithme d’optimisation nouvellement proposé appelé Clan Updated Grey Wolf Optimization (CU-GWO).
L’équipe a constaté que leur approche pouvait surpasser les méthodes existantes sur diverses mesures de performance. Plus précisément, elle améliore la spécificité, réduit les taux de faux négatifs et présente des valeurs de corrélation supérieures par rapport aux approches standard.
Au-delà de ses implications immédiates pour le traitement du langage naturel et l’analyse des sentiments, la recherche est prometteuse pour l’amélioration des algorithmes d’analyse des sentiments, des outils de surveillance des médias sociaux et des systèmes automatisés de service client.