Classification audio avec réservoirs skyrmion

Classification audio avec réservoirs skyrmion

a) Schéma d’un réservoir skyrmion multicontact avec 39 contacts électriques de chaque côté. Les points sombres représentent les noyaux de skyrmion et la palette de couleurs cyclique qui les entoure représente l’orientation de l’aimantation dans le plan. Les contacts ont été agrandis pour plus de visibilité. b) Distribution aléatoire des grains sous-jacents au réservoir de skyrmion. Chaque grain a une force d’anisotropie particulière.

« Sept, un, neuf, … »: Une voix humaine prononce des chiffres, un matériel physique les reconnaît avec une précision d’environ 97%. Ce système de reconnaissance de formes a été développé par des physiciens de l’Université de Duisburg-Essen (UDE) en collaboration avec l’Université de Gand (Belgique). Le développement permet de résoudre rapidement et sans formation énergivore des problèmes multidimensionnels. Le journal Systèmes intelligents avancés publié les résultats.

Est-il possible pour un matériau inanimé de reconnaître des motifs rapidement et efficacement ? Telle était la question posée par une équipe de physiciens théoriciens, dirigée par le professeur Dr. Karin Everschor-Sitte. Pour prouver leur point de vue, les chercheurs ont utilisé la reconnaissance vocale.

L’équipe, dont Robin Msiska en tant que premier auteur, a utilisé des enregistrements audio des chiffres parlés allant de 0 à 9 à partir d’une base de données standard. Les physiciens ont analysé le type et l’intensité des fréquences impliquées pour chaque instant de la parole. Par la suite, ils ont converti ces informations en signaux de tension, qu’ils ont appliqués à un film magnétique mince via 39 contacts.

Ce matériau à couche mince contient de petits tourbillons magnétiques (skyrmions) qui réagissent à la tension en se déformant. « Pour le dire simplement, vous pouvez l’imaginer comme un motif de grille noir et blanc qui change de forme en réponse aux signaux d’entrée », explique Msiska. Le matériau forme ainsi des modèles uniques pour chaque numéro prononcé, comme un code QR, qui peuvent être lus linéairement avec des méthodes simples.

Les recherches de l’équipe ont utilisé des simulations complexes, principalement réalisées au Centre flamand des superordinateurs (Vlaams Supercomputer Centrum) en collaboration avec l’Université de Gand. Leur système matériel a correctement reconnu 97,4% des nombres. En examinant uniquement les voix féminines, le chiffre est passé à 98,5 %. « Cela montre les meilleures performances jamais rapportées pour les ordinateurs à réservoir dans le matériau », rapporte Everschor-Sitte. Et il le fait dans le plus petit des espaces ; l’échantillon avec lequel les physiciens ont travaillé n’a qu’un micromètre de longueur d’arête.

« Si l’on utilise un réseau de neurones, la formation est coûteuse et nécessite d’énormes ensembles de données. Notre système matériel peut résoudre les problèmes d’apprentissage automatique sans construire un système de millions de neurones interconnectés – la reconnaissance vocale présentée ici n’est qu’un exemple. Elle est plus rapide et utilise moins l’énergie », explique le physicien.

Selon elle, des applications potentielles peuvent être trouvées là où divers signaux doivent être détectés et interprétés : dans la conduite autonome, dans les prévisions météorologiques ou dans le domaine médical. En collaboration avec d’autres chercheurs de l’UDE, ils se concentrent actuellement sur un examen médical standard : l’électroencéphalogramme (EEG), qui mesure l’activité électrique du cerveau. Les physiciens étudient si le système magnétique peut interpréter ces résultats de manière indépendante.

Fourni par Universität Duisburg-Essen