ChatGPT est un cauchemar pour la confidentialité des données. Si vous avez déjà posté en ligne, vous devriez vous inquiéter, dit le chercheur

Crédit : Shutterstock

ChatGPT a pris le monde d’assaut. Dans les deux mois suivant sa sortie, il a atteint 100 millions utilisateurs actifsce qui en fait le consommateur à la croissance la plus rapide application jamais lancée. Les utilisateurs sont attirés par l’outil capacités avancées— et préoccupé par son potentiel de perturbation dans divers secteurs.

Une implication beaucoup moins discutée est les risques de confidentialité que ChatGPT pose à chacun d’entre nous. Juste hier, Google dévoilé sa propre IA conversationnelle appelée Bard, et d’autres suivront sûrement. Les entreprises technologiques travaillant sur l’IA sont bel et bien entrées dans une course aux armements.

Le problème est qu’il est alimenté par nos données personnelles.

300 milliards de mots. Combien sont les vôtres ?

ChatGPT est soutenu par un grand modèle de langage qui nécessite d’énormes quantités de données pour fonctionner et s’améliorer. Plus le modèle est formé sur des données, mieux il détecte les modèles, anticipe ce qui va suivre et génère un texte plausible.

OpenAI, la société à l’origine de ChatGPT, a alimenté l’outil 300 milliards de mots systématiquement extraits d’Internet : livres, articles, sites Web et publications, y compris les informations personnelles obtenues sans consentement.

Si vous avez déjà écrit un article de blog ou une critique de produit, ou commenté un article en ligne, il y a de fortes chances que ces informations aient été consommées par ChatGPT.

Alors pourquoi est-ce un problème?

La collecte de données utilisée pour former ChatGPT est problématique pour plusieurs raisons.

Tout d’abord, aucun d’entre nous n’a été demandé si OpenAI pouvait utiliser nos données. Il s’agit d’une violation manifeste de la vie privée, en particulier lorsque les données sont sensibles et peuvent être utilisées pour nous identifier, les membres de notre famille ou notre emplacement.

Même lorsque les données sont accessibles au public, leur utilisation peut enfreindre ce que nous appelons intégrité textuelle. Il s’agit d’un principe fondamental dans les discussions juridiques sur la vie privée. Elle exige que les informations des individus ne soient pas révélées en dehors du contexte dans lequel elles ont été initialement produites.

De plus, OpenAI ne propose aucune procédure permettant aux particuliers de vérifier si l’entreprise stocke leurs informations personnelles ou de demander leur suppression. Il s’agit d’un droit garanti conformément au règlement européen général sur la protection des données (RGPD)—bien que la conformité de ChatGPT soit toujours en débat avec les exigences du RGPD.

Ce « droit à l’oubli » est particulièrement important dans les cas où l’information est inexacte ou trompeuse, ce qui semble être un occurrence régulière avec ChatGPT.

De plus, les données récupérées sur lesquelles ChatGPT a été formé peuvent être propriétaires ou protégées par des droits d’auteur. Par exemple, lorsque je l’ai demandé, l’outil a produit les premiers paragraphes du roman de Peter Carey « True History of the Kelly Gang » – un texte protégé par le droit d’auteur.

ChatGPT est un cauchemar en matière de confidentialité des données - si vous avez déjà publié des messages en ligne, vous devriez vous inquiéter — ChatGPT ne tient pas compte de la protection des droits d’auteur lors de la génération des sorties. Toute personne utilisant les sorties ailleurs pourrait plagier par inadvertance. ChatGPT, fourni par l’auteur

Enfin, OpenAI n’a pas payé pour les données récupérées sur Internet. Les particuliers, les propriétaires de sites Web et les entreprises qui l’ont produit n’ont pas été indemnisés. Ceci est particulièrement remarquable étant donné qu’OpenAI a récemment été évalué à 29 milliards de dollars américainsplus du double de son valeur en 2021.

OpenAI vient également annoncé ChatGPT Plus, un plan d’abonnement payant qui offrira aux clients un accès continu à l’outil, des temps de réponse plus rapides et un accès prioritaire aux nouvelles fonctionnalités. Ce plan contribuera aux prévisions chiffre d’affaires de 1 milliard de dollars d’ici 2024.

Rien de tout cela n’aurait été possible sans les données – nos données – collectées et utilisées sans notre permission.

Une politique de confidentialité fragile

Un autre risque de confidentialité concerne les données fournies à ChatGPT sous la forme d’invites d’utilisateur. Lorsque nous demandons à l’outil de répondre à des questions ou d’effectuer des tâches, nous pouvons par inadvertance remettre information sensible et le mettre dans le domaine public.

Par exemple, un avocat peut demander à l’outil d’examiner un projet d’accord de divorce, ou un programmeur peut lui demander de vérifier un morceau de code. L’accord et le code, en plus des essais produits, font désormais partie de la base de données de ChatGPT. Cela signifie qu’ils peuvent être utilisés pour former davantage l’outil et être inclus dans les réponses aux invites d’autres personnes.

Au-delà de cela, OpenAI rassemble un large éventail d’autres informations sur les utilisateurs. Selon la société politique de confidentialitéil collecte l’adresse IP des utilisateurs, le type de navigateur et les paramètres, ainsi que des données sur les interactions des utilisateurs avec le site, y compris le type de contenu avec lequel les utilisateurs interagissent, les fonctionnalités qu’ils utilisent et les actions qu’ils entreprennent.

Il collecte également des informations sur les activités de navigation des utilisateurs au fil du temps et sur les sites Web. De manière alarmante, OpenAI déclare qu’il pourrait partager les informations personnelles des utilisateurs avec des tiers non spécifiés, sans les en informer, pour atteindre leurs objectifs commerciaux.

Il est temps de le maîtriser ?

Certains experts pensent que ChatGPT est un tournant pour l’IA— une réalisation du développement technologique qui peut révolutionner notre façon de travailler, d’apprendre, d’écrire et même de penser. Nonobstant ses avantages potentiels, nous devons nous rappeler qu’OpenAI est une entreprise privée à but lucratif dont les intérêts et les impératifs commerciaux ne correspondent pas nécessairement aux besoins sociétaux plus importants.

Les risques de confidentialité liés à ChatGPT devraient sonner comme un avertissement. Et en tant que consommateurs d’un nombre croissant de technologies d’IA, nous devons être extrêmement prudents quant aux informations que nous partageons avec ces outils.

The Conversation a contacté OpenAI pour obtenir des commentaires, mais ils n’ont pas répondu dans les délais.

Fourni par La Conversation