Faire progresser une IA plus consciente de notre contexte émotionnel et culturel
L’Université des sciences et technologies du roi Abdallah (KAUST) a montré pour la première fois avec un ensemble de données à grande échelle comment les émotions peuvent varier en réponse à des stimuli visuels dans plusieurs langues et cultures.
ArtELingo est un ensemble de données multilingue avec des explications émotionnelles construites à partir de l’exposition à 80 000 stimuli visuels (œuvres d’art visuelles) dans plusieurs langues. Sa version actuelle, acceptée dans l’ensemble de données, comprend plus de 420 000 de ces annotations pour chacune des langues anglaise, chinoise et arabe. Une petite version a également été collectée en espagnol sur plus de 1000 œuvres d’art d’Amérique latine et d’Europe latine pour explorer comment deux cultures différentes parlant la même langue peuvent varier en termes d’émotions construites.
L’article ArtELingo a été présenté à la conférence 2022 sur les méthodes empiriques dans le traitement du langage naturel (EMNLP).
ArtELingo est une étape vers la création d’ensembles de données culturellement diversifiés qui représentent bien les cultures occidentales et non occidentales. Cela aidera particulièrement ceux qui recherchent des données lorsqu’ils étudient la psychologie culturelle et interculturelle. Dans l’ensemble, cette recherche contribue à faire progresser la construction d’une IA plus compatible avec l’homme et consciente de nos êtres émotionnels et culturels.
Ce projet a été développé par Youssef Mohamed, Mohamed Abdelfattah, Shyma Alhuwaider, Feifan Li et Mohamed Elhoseiny (PI) de KAUST, et des collaborateurs de l’Université de Notre Dame (Xiangliang Zhang) et de l’église Kenneth Ward (NorthEastern University).
Les auteurs souhaitent remercier Baidu, Beijing time pour leur soutien dans la collecte de la version chinoise de l’ensemble de données, et des dizaines d’universités d’Égypte (principalement) et d’Arabie saoudite pour la collecte de la version arabe.
L’ouvrage est publié sur le arXiv serveur de préimpression.