L'outil d'IA d'un diplômé en littérature anglaise déchiffre les biographies de Twitter, facilitant ainsi l'analyse de texte

Un diplômé en littérature anglaise devenu data scientist a développé une nouvelle méthode pour les grands modèles de langage (LLM) utilisés par les chatbots IA pour comprendre et analyser de petits morceaux de texte, tels que ceux sur les profils de réseaux sociaux, dans les réponses des clients en ligne ou pour comprendre les réponses aux messages en ligne. aux événements catastrophiques.

Dans le monde numérique d’aujourd’hui, l’utilisation de textes courts est devenue essentielle dans la communication en ligne. Cependant, l’analyse de ces extraits est difficile car ils manquent souvent de mots ou de contexte partagés. Ce manque de contexte rend difficile pour l’IA de trouver des modèles ou de regrouper des textes similaires.

La nouvelle recherche aborde le problème en utilisant de grands modèles linguistiques (LLM) pour regrouper de grands ensembles de données de textes courts en clusters. Ces clusters condensent potentiellement des millions de tweets ou de commentaires en groupes faciles à comprendre générés par le modèle.

doctorat L’étudiant Justin Miller a développé cette méthode pour l’utiliser par des programmes d’IA qui ont réussi à produire des catégories cohérentes après avoir analysé près de 40 000 biographies d’utilisateurs de Twitter (X) à partir de comptes tweetant sur le président américain Donald Trump pendant deux jours en septembre 2020.

Le modèle linguistique développé par Miller, diplômé en littérature anglaise, a regroupé les biographies en 10 catégories et a attribué des scores au sein de chacune de ces catégories pour aider à analyser l’occupation probable des tweeters, leur tendance politique ou même leur utilisation des émojis.

L’étude est publiée dans le Science ouverte de la Royal Society journal.

Miller a déclaré : « Ce qui distingue cette étude, c’est l’accent mis sur la conception centrée sur l’humain. Les clusters créés par les grands modèles de langage sont non seulement efficaces sur le plan informatique, mais ont également un sens pour les gens.

« Par exemple, les textes sur la famille, le travail ou la politique sont regroupés de manière à ce que les humains puissent les nommer et les comprendre intuitivement. En outre, la recherche montre que l’IA générative, telle que ChatGPT, peut imiter la façon dont les humains interprètent ces groupes.

« Dans certains cas, l’IA a fourni des noms de clusters plus clairs et plus cohérents que les évaluateurs humains, en particulier lorsqu’il s’agit de distinguer des modèles significatifs du bruit de fond. »

Miller, doctorant à l’École de physique et membre du laboratoire de sciences sociales computationnelles, a déclaré que l’outil qu’il a développé pourrait être utilisé pour simplifier de grands ensembles de données, obtenir des informations pour la prise de décision et améliorer la recherche et l’organisation.

À l’aide de grands modèles linguistiques (LLM), les auteurs ont créé des clusters en utilisant une méthodologie connue sous le nom de « modélisation de mélange gaussien » qui capturent l’essence du texte et sont plus faciles à comprendre pour les humains. Ils ont validé ces groupes en comparant les interprétations humaines avec celles d’un LLM génératif, qui correspondaient étroitement aux évaluations humaines.

Cette approche a non seulement amélioré la qualité du regroupement, mais suggère également que les évaluations humaines, bien que précieuses, pourraient ne pas être la seule norme de validation des clusters.

Miller a déclaré : « Les grands ensembles de données, qui seraient impossibles à lire manuellement, peuvent être réduits en groupes significatifs et gérables. »

Les applications incluent :

Simplification des grands ensembles de données : les grands ensembles de données, qui seraient impossibles à lire manuellement, peuvent être réduits en groupes significatifs et gérables. Par exemple, M. Miller a appliqué les mêmes méthodes que celles de cet article à un autre projet sur la guerre entre la Russie et l’Ukraine. En regroupant plus d’un million de publications sur les réseaux sociaux, il a identifié 10 sujets distincts, notamment les campagnes de désinformation russes, l’utilisation d’animaux comme symboles dans l’aide humanitaire et les tentatives de l’Azerbaïdjan de montrer son soutien à l’Ukraine.
Obtenir des informations pour la prise de décision : les clusters fournissent des informations exploitables aux organisations, aux gouvernements et aux entreprises. Une entreprise peut utiliser le clustering pour identifier ce que les clients aiment ou n’aiment pas dans leur produit, tandis que les gouvernements peuvent l’utiliser pour condenser un large éventail d’opinions publiques en quelques sujets.
Améliorer la recherche et l’organisation : pour les plates-formes gérant de grands volumes de contenu généré par les utilisateurs, le clustering facilite l’organisation, le filtrage et la récupération des informations pertinentes. Cette méthode peut aider les utilisateurs à trouver rapidement ce qu’ils recherchent et à améliorer la gestion globale du contenu.

Miller a déclaré : « Cette double utilisation de l’IA pour le regroupement et l’interprétation ouvre des possibilités significatives. En réduisant le recours à des évaluations humaines coûteuses et subjectives, elle offre un moyen évolutif de donner un sens à des quantités massives de données textuelles. De l’analyse des tendances des médias sociaux à la crise. surveillance ou connaissance des clients, cette approche combine l’efficacité des machines et la compréhension humaine pour organiser et expliquer les données de manière efficace.