Une étude révèle que les images générées par l’IA représentent une jeunesse idéalisée
Si vous utilisez l'intelligence artificielle (IA) depuis un certain temps, vous avez peut-être remarqué que les textes et les images qu'elle crée peuvent être un peu génériques et raffinés. Certains les qualifieraient de sans âme.
Ou, comme le dit le professeur Gunhild Kvåle de l’Université d’Agder : « ChatGPT a une voix qui me donne une démangeaison particulière. »
Avec son collègue Gustav Westberg de l'université d'Örebro en Suède, elle a étudié comment l'outil d'IA Dall-E 3 crée des images d'adolescents. Dall-E est un générateur d'images intégré à ChatGPT.
L'un des objectifs de l'étude, désormais publiée dans Discours et sociétéc'était de découvrir d'où venait cette démangeaison. Qu’est-ce qui crée cette qualité artificielle dans les images IA ? Ils ont constaté que les images présentent quatre caractéristiques communes. Certains d’entre eux sont préoccupants, estiment les chercheurs.
Diversité au niveau de la surface
« Il est frappant de voir à quel point Dall-E s'intéresse, d'un côté, à la diversité ethnique et de genre, alors que, de l'autre, les images ne sont pas très diverses, » dit Kvåle.
Pour obtenir un échantillon d'images représentatif et comparable, les chercheurs ont fourni des instructions générales telles que « créer des images d'adolescents. » Ils ont également demandé à l’IA de générer ses propres invites textuelles pour créer les images.
« Vous pouvez voir que les adolescents sur les images sont censés représenter différentes ethnies. Il était également frappant de voir à quel point la diversité était fortement soulignée lorsque ChatGPT lui-même rédigeait les invites : » dit Kvåle.
Cela suggère que les entreprises à l'origine de la technologie ont pris en compte les critiques concernant le manque de diversité des versions précédentes.
Mais, dit Kvåle, « Les jeunes sur les images sont étonnamment similaires. Elles portent toutes des jeans et des chaussures Converse, sont belles, avec de jolis traits et des cheveux volumineux, et aucune n'a de boutons. Il s’agit d’une catégorie sociale spécifique de jeunes adolescents beaux et prospères. »
Le bonheur se vend
L’autre point commun est que les images sont très positives. Les jeunes sont représentés comme étudiant ensemble, assistant à des concerts, faisant griller des guimauves ou, de manière absurde, collaborant à un jardin communautaire local.
« Tout le monde est heureux dans les images, personne n'est triste. Ils s'engagent dans des activités valorisées par la société. Mais aucune des images ne les montre au travail ou en train de dormir. C'est le temps libre des jeunes de la haute bourgeoisie, » dit Kvåle.
Certaines normes sont également inscrites dans cette représentation positive. Tout le monde est mince, et même des invites directes ne pourraient pas changer cela.
« La technologie fixe des limites claires quant aux types d’images qu’il est possible de créer. Ce n’est pas entièrement positif, même si les intentions sont bonnes. Nous pouvons le voir dans le contexte de la culture dans laquelle nous vivons, où les textes et les images que nous partageons ne sont pas seulement destinés à nous informer objectivement, mais aussi à nous promouvoir. »
Presque réel, mais pas tout à fait
Kvåle note que l'éclairage et la façon dont les objets sont placés au premier plan ou à l'arrière-plan imitent la photographie. C’était la troisième caractéristique commune qu’ils ont identifiée.
Les décors représentés dans les images varient des parcs et des clubs de jeunes aux scènes de concert et aux chambres d'adolescents en désordre.
« Les images créent une impression d'authenticité, mais à travers le contexte, ces jeunes se positionnent aussi socialement. Ils ne sont jamais représentés au travail ou dans des milieux urbains associés à des enjeux sociaux, » dit-elle.
Les limites de l'imagination
La quatrième découverte faite par les chercheurs concerne la façon dont l'IA peut afficher des situations imaginatives, comme des jeunes patinant à l'intérieur d'une boule à neige au pôle Nord.
Cependant, ce n’est pas la norme chez Dall-E, c’est quelque chose que vous devez spécifiquement demander.
« Les images photoréalistes sont évidemment préférées par Dall-E. Parfois, elles se transforment en illustrations graphiques, mais le photoréalisme est clairement la norme, » explique Kvale.
Conscience critique
Les générateurs d'images tels que Dall-E 3 sont devenus très performants et accessibles à tous. Cependant, nous ne nous noyons pas sous les images générées par l’IA. En fait, il y en a étonnamment peu, selon Kvåle.
« On dit que tout sera changé grâce à l’intelligence artificielle, mais ce n’est clairement pas vrai. Les salles de rédaction, les services de communication et les institutions ont des normes industrielles. Tout ne change pas du jour au lendemain simplement parce que c'est possible, » dit-elle.
Dans le même temps, les chercheurs ont été surpris par la similitude des images.
« Des services comme Dall-E peuvent avoir une forte influence sur notre culture visuelle. Nous nous devons d'avoir une conscience critique de ces images, car elles ne représentent pas l'image que nous souhaitons donner à notre société, » dit Kvåle, concluant par :
« Et cela rend le monde un peu plus ennuyeux. »