La détection des robots ne fonctionne plus et attendez simplement que les agents IA arrivent
Vous êtes en retard à l'aéroport et devez accéder de toute urgence à votre compte, pour ensuite être accueilli par l'un de ces tests frustrants : « Sélectionnez toutes les images avec des feux de circulation » ou « Tapez les lettres que vous voyez dans cette case ». Vous louchez, vous devinez, mais d'une manière ou d'une autre, vous vous trompez. Vous effectuez un autre test mais le site n'est toujours pas satisfait.
« Votre vol embarque maintenant », annonce le tannoy alors que le site Web vous propose une autre énigme. Vous jurez devant l'écran, fermez votre ordinateur portable et vous précipitez vers le portail.
Maintenant, voici une pensée pour vous remonter le moral : les robots résolvent désormais ces énigmes en quelques millisecondes grâce à l'intelligence artificielle (IA). Quelle ironie. Les outils conçus pour prouver que nous sommes humains nous gênent désormais davantage que les machines qu’ils sont censés tenir à distance.
Bienvenue dans l’étrange bataille entre la détection des robots et l’IA, qui devrait devenir encore plus compliquée dans les années à venir à mesure que la technologie continue de s’améliorer. Alors, à quoi ressemble l’avenir ?
Le Captcha, qui signifie Test de Turing public entièrement automatisé pour distinguer les ordinateurs des humains, a été inventé au début des années 2000 par une équipe d'informaticiens de l'Université Carnegie Mellon de Pittsburgh. L’idée était simple : amener les internautes à prouver leur humanité via des tâches qu’ils peuvent facilement accomplir, mais que les machines trouvent difficiles.
Les machines faisaient déjà des ravages en ligne. Les sites Web ont été inondés de robots qui créaient de faux comptes pour acheter des billets de concert, ou publiaient des commentaires automatisés pour commercialiser du faux Viagra ou pour inciter les utilisateurs à participer à des escroqueries. Les entreprises avaient besoin d'un moyen de mettre fin à cette activité pernicieuse sans perdre d'utilisateurs légitimes.
Les premières versions de Captcha étaient basiques mais efficaces. Vous verriez des lettres ondulées et déformées et vous les taperiez dans une boîte. Les robots ne pouvaient pas « lire » le texte comme le feraient les humains, les sites Web restaient donc protégés.
Cela a connu plusieurs itérations au cours des années suivantes : ReCaptcha a été créé en 2007 pour ajouter un deuxième élément dans lequel il fallait également saisir un mot déformé d'un vieux livre.
Puis, en 2014, désormais acquis par Google, est arrivé reCaptcha v2. C'est celui qui demande aux utilisateurs de cocher la case « Je ne suis pas un robot » et de choisir souvent parmi une sélection d'images contenant des chats ou des pièces de vélo, ou autre. Encore le plus populaire aujourd'hui, Google est payé par les entreprises qui utilisent le service sur leur site Web.
Comment l’IA a dépassé le système
Les systèmes d'IA d'aujourd'hui peuvent résoudre les défis sur lesquels reposent ces Captchas. Ils peuvent « lire » un texte déformé, de sorte que les lettres ondulées ou écrasées des tests Captcha originaux leur soient faciles. Grâce au traitement du langage naturel et à l’apprentissage automatique, l’IA peut décoder même les mots les plus compliqués.
De même, les outils d'IA tels que Google Vision et OpenAI's Clip peuvent reconnaître des centaines d'objets plus rapidement et avec plus de précision que la plupart des humains. Si un Captcha demande à une IA de cliquer sur tous les bus d’une sélection d’images, elle peut le résoudre en quelques fractions de seconde, alors que cela peut prendre 10 à 15 secondes à un humain.
Ce n'est pas seulement un problème théorique. Pensez aux examens de conduite : les listes d'attente pour les examens en Angleterre durent plusieurs mois, même si vous pouvez obtenir un examen beaucoup plus rapide en payant des frais plus élevés à un revendeur du marché noir. Le Guardian a rapporté en juillet que les rabatteurs utilisaient couramment un logiciel automatisé pour réserver tous les créneaux de test, tout en échangeant les candidats pour s'adapter à leurs horaires en constante évolution.
Faisant écho à la situation d'il y a 20 ans, des problèmes similaires se posent avec les billets pour des événements tels que les matchs de football. Dès que les billets deviennent disponibles, les robots submergent le système, contournant les Captchas, achetant des billets en gros et les revendant à des prix gonflés. Les utilisateurs authentiques sont souvent laissés pour compte car ils ne peuvent pas fonctionner aussi rapidement.
De la même manière, les robots attaquent les plateformes de réseaux sociaux, les sites de commerce électronique et les forums en ligne. Les faux comptes diffusent des informations erronées, publient du spam ou récupèrent des articles limités pendant les soldes. Dans de nombreux cas, Captcha n’est plus en mesure de stopper ces abus.
Que se passe-t-il maintenant ?
Les développeurs proposent continuellement de nouvelles façons de vérifier les humains. Certains systèmes, comme ReCaptcha v3 de Google (introduit en 2018), ne vous demandent plus de résoudre des énigmes. Au lieu de cela, ils surveillent la façon dont vous interagissez avec un site Web. Déplacez-vous votre curseur naturellement ? Tapez-vous comme une personne ? Les humains ont des comportements subtils et imparfaits que les robots ont encore du mal à imiter.
Tout le monde n'aime pas ReCaptcha v3 car il soulève des problèmes de confidentialité. De plus, l'entreprise Web doit évaluer les scores des utilisateurs pour déterminer qui est un robot, et les robots peuvent de toute façon battre le système. Il existe des alternatives qui utilisent une logique similaire, telles que les puzzles à « curseur » qui demandent aux utilisateurs de déplacer les pièces du puzzle, mais celles-ci peuvent également être surmontées.
Captcha du curseur :
Certains sites Web se tournent désormais vers la biométrie pour vérifier les humains, comme la numérisation d'empreintes digitales ou la reconnaissance vocale, tandis que l'identification faciale est également une possibilité. Les robots ont plus de mal à falsifier la biométrie, mais ils entraînent leurs propres problèmes : problèmes de confidentialité, technologie coûteuse et accès limité pour certains utilisateurs, par exemple parce qu'ils n'ont pas les moyens d'acheter le smartphone concerné ou ne peuvent pas parler en raison d'un handicap.
L’arrivée imminente des agents IA ajoutera une autre couche de complexité. Cela signifiera que nous souhaiterons de plus en plus que les robots visitent les sites et fassent des choses en notre nom. Les entreprises Web devront donc commencer à faire la distinction entre les « bons » robots et les « mauvais » robots. Ce domaine nécessite encore beaucoup plus de réflexion, mais les certificats d'authentification numérique sont proposés comme une solution possible.
En résumé, Captcha n’est plus l’outil simple et fiable qu’il était autrefois. L'IA nous a obligés à repenser la façon dont nous vérifions les personnes en ligne, et cela deviendra de plus en plus difficile à mesure que ces systèmes deviendront plus intelligents. Quelle que soit la prochaine norme technologique, elle devra être facile à utiliser pour les humains, mais avec une longueur d'avance sur les mauvais acteurs.
Alors la prochaine fois que vous vous retrouverez à cliquer sur des feux de circulation flous et à vous mettre en colère, n'oubliez pas que vous faites partie d'un combat plus important. L’avenir de la preuve de l’humanité est encore en train de s’écrire, et les robots n’abandonneront pas de sitôt.