Nous sommes plus près de "sauver" notre voix grâce à l'IA. Et c'est un pas de géant pour la médecine

Ron Brady a reçu un diagnostic de SLA à 52 ans. Cette terrible maladie neurodégénérative finit par entraîner dans de nombreux cas la perte totale de mouvement, de respiration ou de parole. Brady, qui a maintenant 55 ans, ne peut plus avaler quand il mange et il lui est difficile de faire beaucoup de choses, mais comme l’indique The Washington Post, il y a une chose qu’il n’a pas perdue : sa voix.

recréer la parole. Une société appelée Voice Keeper fait ce miracle particulier. Sa technologie, basée sur l’intelligence artificielle, parvient à enregistrer, recréer puis stocker des voix qui seront ensuite utilisées dans les systèmes logiciels de dictée. Dans ce cas, Brady est capable de parler tout de suite en tapant ce qu’il veut dire sur un clavier. « Ma chose préférée à dire est tout ce qui est ringard en tant que père qui fait rire ma femme ou mes enfants adultes », dit-il.

Une bénédiction pour ceux qui perdent la parole. Ces types de processus étaient coûteux et consommaient énormément de temps et de ressources, mais l’IA les a rendus beaucoup plus accessibles et particulièrement utiles pour les patients atteints de SLA, de cancer de la gorge, de paralysie cérébrale ou de la maladie de Parkinson. Tous sont grâce à cette option pour récupérer cette confiance lorsqu’il s’agit de communiquer avec le monde.

Une idée qui couvait depuis des années. En 2016, nous parlions de Smartstones (maintenant Cognixion), une entreprise qui combinait un appareil EEG et une application appelée prose (maintenant Speakprose) qui transformait la pensée en parole. C’était une autre option prometteuse pour les patients atteints de SLA ou d’autisme et d’autres ont suivi, mais ce qui est clair, c’est que l’IA a porté ces types de solutions à un nouveau niveau.

Comment l’IA aide. Jusqu’à présent, la capture de la parole humaine nécessitait que la personne enregistre entre 1 000 et 6 000 phrases (jusqu’à 30 heures d’audio) afin de générer ultérieurement n’importe quel son dans une langue. Les résultats étaient acceptables, mais pas idéaux. C’est le cas de Ruth Brunton, qui a utilisé une voix synthétisée par Microsoft appelée « Heather » qui ne ressemblait pas du tout à sa voix. Après avoir essayé à nouveau de générer sa voix avec une IA, le résultat a été étonnant pour elle : n’utilisant cette première voix que par nécessité, la nouvelle voix synthétique était pour elle comme récupérer ce qu’elle avait perdu.

Comment l’IA a tout changé. Maintenant, l’IA analyse un échantillon de la voix d’une personne et fouille dans une grande base de données pour trouver des voix similaires. En trouvant des modèles, il crée une voix numérique qui correspond beaucoup mieux à ce haut-parleur. Certaines entreprises n’ont besoin que de 50 phrases pour construire cette recréation de la voix.

Liberté. D’autres personnes touchées par la SLA qui participent à l’émission, comme Brian Wallach, ont expliqué que pour lui, « cette voix est la liberté ». Il peut taper pour l’instant, mais comme Brady, il viendra un moment où il devra utiliser ses yeux pour taper, ce qui ralentira davantage la conversation. Et pourtant, une chose est sûre : votre voix sera toujours là chaque fois que vous voudrez l’utiliser.