Vous êtes « user84721 » depuis des années. Une étude vient de montrer que l'IA peut savoir qui vous êtes en quelques minutes

Les comptes sans photo de profil ni vrai nom envahissent les réseaux sociaux ; peut-être même que vous, qui lisez ces lignes, en êtes propriétaire. Nous ne jugeons pas, il existe de nombreuses raisons de ne pas montrer votre visage sur les réseaux et, de fait, l'anonymat est le pilier sur lequel Internet s'est construit. Cependant, si vous pensiez que vous appeler « user84721 » et avoir une photo de paysage vous protégeait, des chercheurs viennent de montrer que les comptes peuvent être désanonymisés en quelques minutes grâce à l'IA (bien sûr).

L'étude. Une équipe de chercheurs a publié une étude intitulée « Désanonymisation à grande échelle en ligne avec de grands modèles de langage » reprise par The Guardian. Dans ce document, ils démontrent comment un agent basé sur LLM est capable de compromettre des comptes anonymes de réseaux sociaux avec une efficacité étonnante. Le processus se compose de trois étapes : le LLM extrait les données d'identification (âge, localisation, intérêts…), recherche les correspondances possibles chez d'autres utilisateurs et enfin les raisons qui sont les meilleurs candidats, vérifie les correspondances et élimine les faux positifs.

Minutes. C'est le temps qu'il a fallu pour identifier les utilisateurs sur des sites comme Reddit, Hacker News et Anthropic Interviewer Dataset participants avec cette méthode. Dans l'image, vous pouvez voir comment, à partir de quelques informations comme le lieu où l'étudiant étudie, l'âge approximatif, la ville et le nom du chien, ils parviennent à une correspondance avec le profil réel de l'utilisateur. Il s’agit d’un cas fictif, mais dans l’expérience, ils ont réussi à identifier de vrais utilisateurs en croisant les informations avec des profils Linkedin et d’autres plateformes.

Selon les chercheurs, les LLM permettent une désanonymisation des comptes à grande échelle, dépassant de loin la rapidité et l’efficacité des méthodes classiques. Ils soulignent également qu’il n’y a pas toujours suffisamment d’informations pour parvenir à une correspondance, donc tout dépend de l’empreinte en ligne de chaque utilisateur.

Conséquences. Les chercheurs préviennent que cette utilisation de l’IA pourrait être utilisée à des fins problématiques, par exemple par les gouvernements souhaitant identifier des activistes ou des cybercriminels cherchant à lancer des attaques hautement personnalisées. De plus, il faut tenir compte du fait que le système n’est pas infaillible et qu’il peut y avoir des faux positifs. S'adressant au Guardian, Peter Bentley, professeur d'informatique à l'UCL, prévient que « les gens vont être accusés de choses qu'ils n'ont pas faites ».

La fin de l'anonymat. Comme nous le disions au début, Internet s’est construit sur l’anonymat de ses utilisateurs, mais nous vivons un virage réglementaire qui cherche justement à y mettre un terme. On le voit avec l'interdiction des réseaux sociaux ou le blocage des sites pornographiques pour mineurs promus par des pays comme le Royaume-Uni, l'Australie, le Danemark et maintenant aussi l'Espagne. Ces initiatives nécessitent l'identification des utilisateurs pour pouvoir accéder à certains contenus via des selfies vidéo, une identification électronique, des systèmes de vérification avec IA… Il existe de nombreuses options, ce qui n'est pas clair, c'est leur efficacité.

Images | Propre élaboration sur fond Google DeepMind

À Simseo | Il n’était pas nécessaire d’inventer un « pajaport », Google l’inclut déjà dans Android. Le vrai défi est en Europe