Est-ce une IA ou un journaliste? La recherche révèle des différences stylistiques dans les articles de presse
Les articles de presse produits par l’intelligence artificielle (IA) n’ont pas le même flair créatif que les histoires écrites par des journalistes humains, selon la recherche sur les différences stylistiques entre les conteurs.
Les chercheurs de l’Université de Charles Darwin (CDU) ont cherché à trouver la différence linguistique entre les articles de presse écrits et générés par les journalistes. L’article « distinguant les journalistes humains des conteurs artificiels à travers des empreintes digitales stylistiques » a été publiée dans les tendances émergentes de l’apprentissage automatique et de l’intelligence artificielle, un numéro spécial de la revue Ordinateur.
Les chercheurs ont nourri 150 articles de presse sur des sujets tels que la politique, les sports, les affaires militaires et la technologie, dans le chatbot Gemini et l’ont incité à composer 150 articles alignés sur le contenu des histoires écrites par l’homme.
Les histoires écrites par l’homme provenaient du New York Times, du Sydney Morning Herald et de l’Australien.
Van Hieu Tran, diplômé de la maîtrise en technologie de l’information de la CDU, qui est le chercheur principal de cette étude, a déclaré que si le contenu généré par l’AI était de plus en plus sophistiquée chaque jour, il y avait encore des différences stylistiques subtiles.
Les chercheurs ont constaté que les journalistes humains avaient une plus grande variété dans la longueur des phrases et des paragraphes, tandis que les Gémeaux avaient un manque de variabilité de syntaxe.
Les journalistes humains utilisent également plus de verbes, suggérant que leur style d’écriture se concentre davantage sur l’explication des actions pour engager les lecteurs. Gemini, en comparaison, utilise plus de noms que les verbes.
« Notre article suggère que l’IA et les écrivains humains produisent un contenu tout aussi lisible », a déclaré Tran.
« Cependant, le document constate également que les écrivains humains produisent des structures syntaxiques et de paragraphe plus diverses dans leurs pièces journalistiques que l’IA. L’IA produit un contenu » plus ennuyeux « qui manque de diversité stylistique et de flair unique des écrivains. »
Le conférencier de la CDU en technologie de l’information, le Dr Yakub Sebastian, souligne que cette recherche est importante car elle suggère que l’ingéniosité humaine et la personnalité profonde pourraient encore prospérer et potentiellement plus attrayantes pour les lecteurs humains.
« Il y a aussi une question plus profonde de savoir si il importe si nous pourrions distinguer l’IA par rapport aux écrivains humains au-delà de la question de l’attribution / de l’originalité, surtout si tous les faits dans les nouvelles sont tout aussi exacts.
« Nous pensons que cela compte parce que les nouvelles façonnent souvent les opinions et les récits, et pas seulement la livraison de faits. Les biais d’IA, par exemple, sont certainement une chose qui nous devait nous préoccuper. »
Le Dr Sebastian, qui a supervisé la recherche et a co-écrit sa publication, a déclaré que ce type de recherche était important étant donné la rapidité avec laquelle l’IA évolue pour ressembler à une copie humaine, et a déclaré que les connaissances acquises dans ce document pouvaient avoir des applications pratiques.
« Les modèles d’IA avancent à une vitesse vertigineuse, et nous les voyons de plus en plus capables de faire ce que les humains peuvent faire », a déclaré le Dr Sebastian.
« En tant que tels, nous pouvons nous attendre à ce que la distinction entre le texte généré par l’homme et le texte généré par l’IA devienne de plus en plus difficile pour les lecteurs humains. Cela se produit déjà. Récemment, un journal italien a officiellement publié les premiers journaux générés par l’AI au monde. »
« Nous pouvons penser à un plug-in de navigateur Web équivalent à Turnitin qui pourrait signaler avec une certaine probabilité que les nouvelles affichées sur le navigateur Web soient générées par AI-en fonction du modèle d’apprentissage automatique que nous avons développé dans cet article. »