Explorer comment ajouter des filigranes électroniques cachés aux œuvres écrites par des systèmes d'IA

Explorer comment ajouter des filigranes électroniques cachés aux œuvres écrites par des systèmes d’IA

Courbes ROC avec valeurs AUC pour la détection de filigrane. Plusieurs choix de paramètre de filigrane δ sont présentés pour (a) l’échantillonnage multinomial et (b) le décodage glouton avec recherche de faisceau à 8 voies. (c,d) Les mêmes graphiques avec des axes semilog. Des valeurs δ plus élevées permettent d’obtenir des performances plus élevées, mais nous voyons en outre que pour un δ donné, la recherche de faisceau permet au filigrane de capturer un peu plus d’AUC que les paramètres correspondants dans le cadre du schéma d’échantillonnage multinomial. Crédit: arXiv (2023). DOI : 10.48550/arxiv.2301.10226

Une équipe d’informaticiens de l’Université du Maryland a développé un moyen d’ajouter des filigranes au texte généré par les systèmes d’IA. Ils ont publié un article décrivant leur approche sur le arXiv serveur de préimpression.

Les systèmes d’IA générant du texte tels que ChatGPT ont fait la une des journaux ces derniers temps. Certains sites d’information ont signalé que des étudiants avaient été surpris en train d’utiliser le chatbot pour écrire des articles à leur place. Et d’autres parties intéressées ont testé leur utilisation lors de tests et ont constaté qu’elles fonctionnaient bien.

Pendant ce temps, les enseignants, les professeurs et d’autres acteurs du domaine de l’éducation sont de plus en plus préoccupés par la manière de procéder car ils deviennent incapables de dire si les documents remis par les étudiants ont été écrits ou non par un système d’IA. Dans ce nouvel effort, le groupe du Maryland a développé un moyen d’aider ceux qui ont de telles préoccupations : l’utilisation de filigranes.

Tout comme pour l’argent liquide ou d’autres documents imprimés, les filigranes sont des informations cachées dans les documents imprimés qui ne peuvent être vues que sous certaines conditions, comme sous une lumière spéciale. Les chercheurs suggèrent que des entreprises comme OpenAI, les créateurs de ChatGPT, pourraient ajouter des identifiants au texte créé par leur bot qui ne peuvent pas être vus par l’utilisateur occasionnel (l’étudiant) mais pourraient être détectés par une application logicielle utilisée par les enseignants. Pour que cette approche fonctionne, la plupart ou la totalité des fabricants de générateurs de texte IA devraient adhérer au plan, de leur plein gré ou sous l’égide du gouvernement.

La création d’un filigrane dans un texte généré par l’IA impliquerait plus que l’ajout d’un peu de métadonnées à un fichier texte (comme c’est le cas avec les photographies), car le texte généré pourrait être facilement copié à l’aide d’un smartphone ou d’un autre appareil.

Ainsi, le filigrane devrait exister dans le texte plutôt que derrière lui. Pour créer un tel filigrane, l’équipe du Maryland a noté que les systèmes de génération de texte fonctionnent en prédisant et en choisissant un mot à la fois lorsqu’ils produisent du texte et qu’ils le font de manière prévisible. Lorsqu’un générateur de texte fonctionne, il choisit des mots qui semblent convenir et qui doivent ensuite être mis sur liste verte par un autre code avant d’être utilisés.

Les chercheurs ont noté que le texte écrit par une IA a tendance à avoir plus de mots sur la liste verte que le texte écrit par des humains, suggérant un modèle qui pourrait être utilisé comme filigrane. Ils ont écrit un algorithme capable de détecter ces mots et ont constaté qu’il fonctionnait de manière assez fiable. Ils notent que leur approche ne peut fonctionner que pour certains systèmes d’IA, mais suggèrent que d’autres systèmes de filigrane pourraient être créés pour d’autres systèmes.