L'IA découvre que toutes les empreintes digitales ne sont pas uniques

De « Law and Order » à « CSI », en passant par la vie réelle, les enquêteurs ont utilisé les empreintes digitales comme référence pour relier les criminels à un crime. Mais si un auteur laisse des empreintes digitales différentes sur deux scènes de crime différentes, ces scènes sont très difficiles à relier et la trace peut devenir inexistante.

C’est un fait bien accepté dans la communauté médico-légale que les empreintes digitales de différents doigts d’une même personne – « empreintes digitales intra-personnes » – sont uniques et, par conséquent, incomparables.

Une équipe dirigée par Gabe Guo, étudiant de premier cycle à Columbia Engineering, a contesté cette présomption largement répandue. Guo, qui n’avait aucune connaissance préalable en médecine légale, a trouvé une base de données publique du gouvernement américain contenant quelque 60 000 empreintes digitales et les a introduites par paires dans un système basé sur l’intelligence artificielle connu sous le nom de réseau contrastif profond. Parfois, les paires appartenaient à la même personne (mais avec des doigts différents), et parfois elles appartenaient à des personnes différentes.

Au fil du temps, le système d’IA, que l’équipe a conçu en modifiant un cadre de pointe, est devenu plus efficace pour déterminer quand des empreintes digitales apparemment uniques appartenaient à la même personne et quand elles n’appartenaient pas à la même personne. La précision pour une seule paire atteint 77 %. Lorsque plusieurs paires étaient présentées, la précision était considérablement plus élevée, augmentant potentiellement l’efficacité médico-légale actuelle de plus de dix fois.

Le projet, une collaboration entre le laboratoire Creative Machines de Hod Lipson à Columbia Engineering et le laboratoire de capteurs et d’informatique intégrés de Wenyao Xu à l’Université de Buffalo, SUNY, a été publié aujourd’hui dans Avancées scientifiques.

Les résultats de l’étude défient – et surprennent – la communauté médico-légale

Une fois que l’équipe a vérifié leurs résultats, elle a rapidement envoyé les résultats à une revue médico-légale bien établie, pour ensuite recevoir un rejet quelques mois plus tard. L’expert et éditeur anonyme a conclu qu’« il est bien connu que chaque empreinte digitale est unique » et qu’il ne serait donc pas possible de détecter des similitudes même si les empreintes digitales provenaient de la même personne.

L’équipe n’a pas abandonné. Ils ont doublé leur avance, alimenté leur système d’IA avec encore plus de données et le système a continué à s’améliorer. Consciente du scepticisme de la communauté médico-légale, l’équipe a choisi de soumettre son manuscrit à un public plus large. Le document a de nouveau été rejeté, mais Lipson, professeur d’innovation James et Sally Scapa au département de génie mécanique et codirecteur du Makerspace Facility, a fait appel.

« Habituellement, je ne conteste pas les décisions éditoriales, mais cette conclusion était trop importante pour être ignorée », a-t-il déclaré. « Si ces informations font pencher la balance, alors j’imagine que des affaires non résolues pourraient être relancées et même que des innocents pourraient être acquittés. »

Même si la précision du système est insuffisante pour trancher officiellement une affaire, il peut aider à prioriser les pistes dans des situations ambiguës. Après de nombreux échanges, l’article a finalement été accepté pour publication par Avancées scientifiques.

Un nouveau type de marqueur médico-légal pour capturer avec précision les empreintes digitales

L’un des points de friction était la question suivante : quelles informations alternatives l’IA utilisait-elle réellement et qui ont échappé à des décennies d’analyse médico-légale ? Après avoir soigneusement visualisé le processus de décision du système d’IA, l’équipe a conclu que l’IA utilisait un nouveau marqueur médico-légal.

« L’IA n’utilisait pas de « minuties », qui sont les ramifications et les extrémités des crêtes d’empreintes digitales, les modèles utilisés dans la comparaison traditionnelle des empreintes digitales », a déclaré Guo, qui a commencé l’étude en tant qu’étudiant de première année à Columbia Engineering en 2021. « Au lieu de cela, , il utilisait autre chose, lié aux angles et courbures des tourbillons et des boucles au centre de l’empreinte digitale. »

Aniv Ray, senior en ingénierie de Columbia, et titulaire d’un doctorat. l’étudiant Judah Goldfeder, qui a aidé à analyser les données, a noté que leurs résultats ne sont qu’un début. « Imaginez à quel point cela fonctionnera une fois qu’il sera formé sur des millions d’empreintes digitales au lieu de milliers », a déclaré Ray.

L’équipe est consciente des biais potentiels dans les données. Les auteurs présentent des preuves qui indiquent que l’IA fonctionne de manière similaire selon les sexes et les races pour lesquels des échantillons étaient disponibles. Cependant, ils notent qu’une validation plus minutieuse doit être effectuée à l’aide d’ensembles de données ayant une couverture plus large si cette technique doit être utilisée dans la pratique.

Potentiel transformateur de l’IA dans un domaine bien établi

Cette découverte est un exemple des choses plus surprenantes que l’IA pourrait apporter, note Lipson : « Beaucoup de gens pensent que l’IA ne peut pas vraiment faire de nouvelles découvertes, qu’elle ne fait que régurgiter des connaissances », a-t-il déclaré. « Mais cette recherche est un exemple de la façon dont même une IA assez simple, étant donné un ensemble de données assez simple que la communauté des chercheurs possède depuis des années, peut fournir des informations qui ont échappé aux experts pendant des décennies. »

Il a ajouté : « Ce qui est encore plus excitant, c’est le fait qu’un étudiant de premier cycle, sans aucune formation en médecine légale, puisse utiliser l’IA pour remettre en question avec succès une croyance largement répandue dans un domaine entier. Nous sommes sur le point de vivre une explosion de découvertes scientifiques basées sur l’IA. par des non-experts, et la communauté des experts, y compris le monde universitaire, doit se préparer. »