Réseaux de neurones : un nouveau système les utilise pour filtrer sélectivement les sons
Les futurs écouteurs antibruit pourraient permettre les personnes malentendantes qui utilisent des appareils électroniques pour entendre à nouveau certains sonscomme les pleurs des enfants, le gazouillis des oiseaux ou la sonnerie des alarmes, même au milieu du bruit.
La technologie qui rend cela possible, appelée l’audition sémantique, cela pourrait ouvrir la voie à des aides auditives et à des écouteurs plus intelligents, permettant aux utilisateurs de filtrer certains sons et d’en améliorer d’autres. Le système a été développé par des chercheurs de l’Université de Washington, qui ont présenté leurs recherches au Symposium ACM sur les logiciels et technologies d’interface utilisateur (UIST) début novembre.comme le rapporte le magazine MIT Technology Review.
Comment ça marche
Le système, qui est encore en phase de prototypetravaux en connectant des écouteurs antibruit disponibles dans le commerce à une application pour smartphone. Les microphones intégrés à ces écouteurs, qui servent à annuler le bruit, sont réutilisés pour détecter également les sons du monde qui entoure celui qui les porte. Ces sons sont ensuite joués par un réseau neuronal, fonctionner sur votre smartphone ; par conséquent, certains sons sont accentués ou supprimés en temps réel, selon les préférences de l’utilisateur.
L’équipe a formé le réseau sur des milliers d’échantillons audio provenant d’ensembles de données en ligne et de sons collectés dans divers environnements bruyants. Il a ensuite appris au réseau à reconnaître 20 sons du quotidien, comme un orage, une chasse d’eau ou un bris de verre.
Le système a été testé sur neuf participants dans divers environnements. Les chercheurs ont constaté que le système fonctionnait bien pour étouffer et amplifier les sons, même dans des situations pour lesquelles il n’avait pas été formé. Cependant, il a eu quelques difficultés à séparer la parole humaine de la musique de fond, en particulier dans le genre rap.
Un système qui imite les capacités humaines
Depuis un certain temps, les chercheurs tentent de résoudre ce qu’on appelle le « problème du cocktail », c’est-à-dire de garantir que un ordinateur se concentre sur une seule voix dans une salle bondée, comme le font les humains. Cette nouvelle méthode représente un pas en avant significatif et démontre le potentiel de la technologie, déclare Marc Delcroix, chercheur principal aux laboratoires NTT Communication Science Laboratories à Kyoto, qui étudie l’amélioration et la reconnaissance de la parole et n’a pas participé au projet.
« Ce genre de résultat est très utile pour l’industrie », dit-il. « Des idées similaires existent depuis un certain temps, notamment dans le domaine de la séparation de la parole, mais elles sont les premières à proposer un système complet d’extraction binaurale du son cible en temps réel. »
« Les écouteurs antibruit d’aujourd’hui ont la capacité de diffuser de la musique même lorsque la suppression du bruit est activée », explique Shyam Gollakota, professeur adjoint à l’Université de Washington, qui a travaillé sur le projet. « Au lieu de jouer de la musique, nous jouons des sons intéressants de l’environnement, que nous avons extraits de nos algorithmes d’apprentissage automatique. »
Gollakota est enthousiasmé par le potentiel de la technologie pour aider les personnes malentendantes, car les aides auditives peuvent être d’une utilité limitée dans des environnements bruyants. «C’est une opportunité unique de créer l’avenir des aides auditives intelligentes grâce à une audition améliorée», dit-il.
La possibilité d’être plus sélectif quant à ce que vous pouvez et ne pouvez pas entendre pourrait également être utile à ceux qui ont besoin d’une écoute ciblée pour leur travail, tels que les professionnels de la santé, de l’armée et de l’ingénierie, ou les ouvriers d’usine ou de construction qui souhaitent protéger leur audition tout en étant capables de le faire. communiquer.