La recherche introduit une nouvelle approche pour détecter les deepfakes

La meilleure façon de déjouer les deepfakes ? Utilisez l’IA pour trouver de vrais signes de vie, disent les scientifiques

L'intelligence artificielle peut rendre difficile, même pour les oreilles les plus exigeantes, la détection des fausses voix – comme en témoignent récemment le faux appel automatisé de Joe Biden et la fausse publicité pour les ustensiles de cuisine de Taylor Swift sur Meta – mais les scientifiques de Klick Labs affirment que la meilleure approche pourrait en fait se résumer à utiliser l’IA pour rechercher ce qui nous rend humains.

Inspirés par leurs études cliniques utilisant des biomarqueurs vocaux pour améliorer les résultats en matière de santé, et par leur fascination pour les films de science-fiction comme « Blade Runner », les chercheurs de Klick ont ​​créé une méthode de détection des deepfakes audio qui exploite les signes de vie, tels que les schémas respiratoires et les micropauses. dans le discours.

« Nos résultats mettent en évidence le potentiel d'utiliser des biomarqueurs vocaux comme une nouvelle approche pour signaler les deepfakes, car ils manquent des signes révélateurs de vie inhérents au contenu authentique », a déclaré Yan Fossat, vice-président senior de Klick Labs et chercheur principal de l'étude. « Ces signes sont généralement indétectables par l'oreille humaine, mais sont désormais perceptibles grâce à l'apprentissage automatique et aux biomarqueurs vocaux. »

« Enquête sur la détection de voix Deepfake à l'aide de modèles de pause vocale : développement et validation d'algorithmes », publié dans JMIR Génie Biomédicaldécrit comment les biomarqueurs vocaux, ainsi que l'apprentissage automatique, peuvent être utilisés pour distinguer les deepfakes de l'audio authentique avec une précision fiable.

Dans le cadre de l'étude, Fossat et son équipe de Klick Labs ont examiné 49 participants d'horizons et d'accents divers. Les modèles Deepfake ont ensuite été formés sur des échantillons vocaux fournis par les participants, et des échantillons audio deepfake ont été générés pour chaque personne. Après avoir analysé les mesures de pause de parole, les scientifiques ont découvert que leurs modèles pouvaient distinguer les vrais des faux avec une précision d'environ 80 %.

Ces résultats font suite à de récentes escroqueries de clonage vocal très médiatisées, au plan annoncé de Meta visant à introduire des étiquettes de contenu générées par l'IA et à la décision de la Commission fédérale des communications de février rendant illégales les fausses voix dans les appels automatisés. En décembre, un rapport de PBS NewsHour citait les inquiétudes des experts en matière de politique publique et d'IA selon lesquelles l'utilisation des deepfakes augmenterait avec la prochaine élection présidentielle américaine.

Bien que la nouvelle étude offre une solution à ce problème croissant, Fossat a reconnu la nécessité de continuer à faire évoluer la technologie de détection à mesure que les deepfakes deviennent de plus en plus réalistes.

L'actualité d'aujourd'hui met en lumière les travaux en cours de Klick sur les biomarqueurs vocaux et l'IA. En octobre, il a annoncé des recherches sur Actes de la clinique Mayo : santé numérique autour du modèle d'IA qu'il a créé pour détecter le diabète de type 2 à l'aide de 10 secondes de voix.

Fourni par Klick Applied Sciences