La technologie de reconnaissance automatique du locuteur surpasse les auditeurs humains dans la salle d’audience
Une question clé dans un certain nombre d’affaires judiciaires est de savoir si un locuteur sur un enregistrement audio est un locuteur connu particulier, par exemple, si un locuteur sur un enregistrement d’un appel téléphonique intercepté est le défendeur.
Dans la plupart des pays anglophones, le témoignage d’un expert n’est recevable devant un tribunal que s’il est susceptible d’aider le juge ou le jury à prendre une décision. Si l’identification de l’orateur par le juge ou le jury était aussi précise ou plus précise que la comparaison de voix médico-légale d’un scientifique médico-légal, alors le témoignage de comparaison de voix médico-légale ne serait pas recevable.
Dans un article de recherche publié dans la revue Sciences médico-légales internationalesune équipe internationale multidisciplinaire de chercheurs a rapporté le premier ensemble de résultats d’une étude approfondie qui compare la précision de l’identification du locuteur par des auditeurs individuels (comme des juges ou des membres de jury) avec la précision d’un système médico-légal de comparaison de voix basé sur sur la technologie de pointe de reconnaissance automatique du locuteur, et cela en utilisant des enregistrements qui reflètent les conditions d’un cas réel.
L’enregistrement du locuteur interrogé était d’un appel téléphonique avec un bruit de fond de bureau, et l’enregistrement du locuteur connu était d’un entretien avec la police mené dans une salle d’écho avec un bruit de fond du système de ventilation.
Le système de comparaison de voix médico-légale a mieux performé que tous les 226 auditeurs qui ont été testés.
L’équipe de recherche était composée de spécialistes des données médico-légales, de juristes, de psychologues expérimentaux et de phonéticiens, basés au Royaume-Uni, en Australie et au Chili.
L’auteur correspondant, le Dr Geoffrey Stewart Morrison, directeur du Forensic Data Science Laboratory à l’Université d’Aston, a déclaré : « Il y a quelques années, alors que je témoignais devant un tribunal, un avocat m’a demandé pourquoi le juge ne pouvait pas simplement écouter les enregistrements et prendre une décision. Le juge ne ferait-il pas mieux que le système médico-légal de comparaison de voix que j’avais utilisé ? »
« C’est l’étincelle qui nous a poussés à mener cette recherche. Je m’attendais à ce que notre système de comparaison vocale médico-légale fonctionne mieux que la plupart des auditeurs, mais j’ai été surpris lorsqu’il a en fait mieux fonctionné qu’eux tous. Je suis heureux que nous avons maintenant une réponse aussi claire à la question posée par l’avocat. »
Le Dr Kristy A Martire, auteure collaboratrice de l’école de psychologie de l’Université de Nouvelle-Galles du Sud, a déclaré: « Les expériences passées où nous avons réussi à reconnaître des locuteurs familiers, tels que des membres de la famille ou des amis, peuvent nous amener à croire que nous sommes meilleurs pour identifier voix inconnues que nous ne le sommes réellement. Cette étude montre que quelle que soit la capacité d’un auditeur à reconnaître des locuteurs familiers, sa capacité à identifier des locuteurs inconnus ne sera probablement pas meilleure qu’un système de comparaison de voix médico-légales.
L’auteur collaborateur, le professeur Gary Edmond, de la faculté de droit de l’Université de Nouvelle-Galles du Sud, a déclaré : « Des découvertes scientifiques sans équivoque montrent que l’identification de locuteurs inconnus par les auditeurs est étonnamment difficile et beaucoup plus sujette aux erreurs que les juges et d’autres ne l’ont apprécié. Nous ne devrions pas encourager ou permettre aux non-experts, y compris les juges et les jurés, de s’engager dans une identification des locuteurs indûment sujette aux erreurs. Au lieu de cela, nous devrions rechercher les services de vrais experts : des spécialistes de la médecine légale qui utilisent des systèmes de comparaison de voix médico-légales empiriquement validés et dont la fiabilité est démontrée. »