Le modèle d'IA bat le CAPTCHA à chaque fois

Un trio de chercheurs en IA de l'ETH Zurich, en Suisse, a modifié un modèle de traitement d'images basé sur l'IA pour résoudre le système de test humain reCAPTCHAv2 de Google.

Andreas Plesner, Tobias Vontobel et Roger Wattenhofer ont modifié le modèle de traitement d'images You Only Look Once (YOLO) pour développer un nouveau modèle capable de résoudre le CAPTCHA de Google à chaque tentative. Leur article est disponible sur le site arXiv serveur de préimpression.

Au cours des dernières décennies, les administrateurs de sites Web ont utilisé des techniques pour empêcher les robots autonomes d'accéder à leurs sites et de causer des problèmes. L'une de ces approches était le modèle appelé Test de Turing public entièrement automatisé pour distinguer les ordinateurs des humains, plus connu sous le nom de CAPTCHA. Les administrateurs de sites Web pouvaient facilement ajouter l'applet à leur processus de connexion.

En 2007, Google a publié sa propre version de l'applet, dont la dernière mise à jour s'appelle reCAPTCHAv2. Comme pour les autres CAPTCHA, celui de Google demande à l'utilisateur de cliquer sur une image désignée pour réussir.

Dans ce nouvel effort, l'équipe suisse a découvert qu'il ne fallait pas beaucoup d'efforts pour modifier un modèle d'IA existant pour lui donner la capacité de passer le CAPTCHA de Google.

Les travaux ont consisté à modifier le modèle YOLO pour qu'il reconnaisse les objets généralement utilisés par reCAPTCHAv2, comme les voitures, les ponts et les feux de circulation. Ils l'ont ensuite entraîné sur des milliers de photographies des mêmes types d'objets.

Les tests ont montré que le modèle n’avait pas besoin d’être précis à 100 % car reCAPTCHAv2, comme d’autres CAPTCHA, autorise plusieurs tentatives. Cela a permis au modèle de réussir le test CAPTCHA à chaque fois qu’il était testé. Les chercheurs ont découvert que même si le nouveau modèle échouait sur les premières images, il réussirait un deuxième puzzle. Ils ont également noté que seules 13 catégories d’objets étaient nécessaires pour apprendre au modèle à réussir le puzzle.

Des tests plus poussés du modèle ont montré qu'il pouvait tromper des CAPTCHA encore plus sophistiqués, modifiés avec des fonctionnalités telles que le suivi de la souris ou l'historique du navigateur. Cette découverte donnera sans aucun doute lieu à de nouvelles recherches visant à créer des CAPTCHA qui ne peuvent pas être trompés par un système d'IA.