La lutte pour distinguer les vrais humains des faux

Les CAPTCHA sont ces défis désormais omniprésents que vous rencontrez pour prouver que vous êtes un humain et non un robot lorsque vous vous connectez à de nombreux sites Web.

Les sites Web et les applications mobiles sont depuis longtemps la cible d'attaques massives de robots. Ces robots malveillants sont programmés pour consommer automatiquement une grande quantité de ressources informatiques, publier des messages de spam, collecter des données sur les sites Web et même enregistrer et authentifier les utilisateurs. Cet état de fait a conduit à l'introduction du CAPTCHA, qui signifie Completely Automated Public Turing test to tell Computers and Humans Apart.

En tant qu’informaticien, je considère les CAPTCHA comme un bouclier efficace pour les sites Web afin de prévenir les attaques automatisées, d’améliorer la cybersécurité et l’expérience utilisateur, du moins à court terme. Par exemple, les attaques par déni de service créent un goulot d’étranglement et provoquent la surcharge et l’absence de réponse d’un serveur Web. Les CAPTCHA aident à empêcher les robots automatisés d’exécuter de telles attaques par déni de service et même des activités frauduleuses telles que l’envoi de messages de spam et la création de faux comptes.

Parallèlement, les institutions financières s'appuient sur les CAPTCHA pour se protéger contre les robots qui tentent de voler les données de leurs clients. De plus, les CAPTCHA améliorent l'intégrité des votes et des sondages en ligne en empêchant les robots automatisés de manipuler les résultats.

Comment fonctionnent les CAPTCHA

Les CAPTCHA sont conçus pour afficher des questions ou des défis faciles à résoudre pour les humains, mais difficiles à résoudre pour les robots informatiques. En pratique, il existe plusieurs types de CAPTCHA : basés sur du texte, des images, des fichiers audio et des comportements.

Les CAPTCHA textuels sont très populaires depuis les débuts d'Internet. Ce type de CAPTCHA oblige les utilisateurs à lire une image de texte déformée et compliquée et à saisir la réponse dans un champ de texte. Une variante du CAPTCHA textuel demande aux utilisateurs de résoudre des problèmes mathématiques simples comme « 18+5 » ou « 23-7 ». Cependant, ce problème a récemment été résolu par des algorithmes avancés de reconnaissance optique de caractères, grâce à la prolifération des IA à apprentissage profond.

Lorsque le texte est modifié pour être plus déformé et plus compliqué, les humains réels ne parviennent ironiquement pas à fournir une réponse correcte.

Le CAPTCHA audio consiste à lire un court extrait audio contenant une série de chiffres ou de lettres prononcés par une voix humaine ou synthétique, que l'utilisateur écoute puis saisit dans un champ de texte prévu à cet effet. La saisie est comparée à la bonne réponse pour déterminer si l'utilisateur est humain. Comme les CAPTCHA textuels, le CAPTCHA audio peut être difficile à interpréter pour les humains en raison de facteurs tels que le bruit de fond, une mauvaise qualité audio, une forte distorsion et des accents inconnus.

Les CAPTCHA basés sur des images ont été introduits pour rendre la tâche plus difficile aux robots. Les utilisateurs doivent identifier des objets spécifiques à partir d'images, par exemple en sélectionnant tous les blocs d'images contenant des feux de circulation. Cette tâche exploite la perception visuelle humaine, qui reste supérieure à la plupart des robots basés sur la vision par ordinateur. Cependant, ce type de CAPTCHA déroute également les gens dans de nombreux cas.

Les CAPTCHA basés sur le comportement analysent les comportements des utilisateurs tels que les mouvements de la souris et les habitudes de frappe. reCAPTCHA, un CAPTCHA basé sur le comportement très répandu, demande aux utilisateurs de cocher la case « Je ne suis pas un robot ». Au cours de ce processus, reCAPTCHA analyse les mouvements et les clics de la souris pour différencier les humains des robots. Les humains ont généralement des comportements plus variés et moins prévisibles, tandis que les robots affichent souvent des actions précises et cohérentes.

IA contre humain

Le CAPTCHA est un autre champ de bataille dans la bataille apparemment sans fin entre l'IA et les humains. De nos jours, l'IA est devenue plus avancée, utilisant des techniques modernes telles que l'apprentissage profond et la vision par ordinateur pour résoudre les défis CAPTCHA.

Par exemple, les algorithmes de reconnaissance optique de caractères se sont améliorés, ce qui rend les CAPTCHA basés sur du texte moins efficaces. Les CAPTCHA audio peuvent être contournés par une technologie avancée de conversion de la parole en texte. De même, les modèles d’IA formés sur de vastes ensembles de données d’images peuvent résoudre de nombreux CAPTCHA basés sur des images avec des taux de précision élevés.

De l’autre côté du champ de bataille, les chercheurs en CAPTCHA ont créé des technologies CAPTCHA plus complexes. Par exemple, reCAPTCHA évalue les interactions des utilisateurs et calcule la probabilité qu’elles soient humaines.

Ironiquement, les humains aident l’IA à résoudre des CAPTCHA complexes. Par exemple, les fermes à clics embauchent un grand nombre de travailleurs mal payés pour cliquer sur des publicités, telles que des publications sur les réseaux sociaux, suivre des comptes, rédiger de faux avis et même résoudre des questions CAPTCHA. Leur travail consiste à aider les systèmes d’IA à se comporter comme des humains afin de déjouer les CAPTCHA et d’autres techniques de prévention de la fraude.

L'avenir des CAPTCHA

L'avenir des CAPTCHA sera influencé par les progrès continus de l'IA. Les méthodes CAPTCHA traditionnelles deviennent de moins en moins efficaces, c'est pourquoi les futurs systèmes CAPTCHA se concentreront probablement davantage sur l'analyse du comportement des utilisateurs, comme la façon dont ils interagissent avec les sites Web, ce qui rendra plus difficile pour les robots d'imiter ce comportement.

Les sites Web pourraient avoir recours à des CAPTCHA biométriques, comme la reconnaissance faciale ou la lecture d’empreintes digitales, même si ces derniers soulèvent des problèmes de confidentialité. Le CAPTCHA peut être remplacé par la blockchain, qui utilise des identifiants vérifiables pour authentifier les utilisateurs. Ces identifiants, émis par des entités de confiance et stockés dans des portefeuilles numériques, garantissent que les interactions sont effectuées par des humains vérifiés plutôt que par des robots.

Les futurs CAPTCHA pourraient fonctionner en temps réel aux côtés des systèmes d’IA, s’adaptant et évoluant constamment pour garder une longueur d’avance sur les attaques automatisées.