L'IA aide la femme britannique à redécouvrir la voix perdue après 25 ans

L'IA aide la femme britannique à redécouvrir la voix perdue après 25 ans

Une femme britannique souffrant d'une maladie des motoneurones qui a perdu sa capacité à parler est une fois de plus en parle de sa propre voix grâce à l'intelligence artificielle et à un clip à peine audible de huit secondes d'une ancienne vidéo domestique.

Sarah Ezekiel, une artiste, a été laissée sans l'utilisation de sa voix après avoir été diagnostiquée à l'âge de 34 ans avec MND alors qu'elle était enceinte de son deuxième enfant il y a 25 ans.

L'état, qui endommage progressivement les parties du système nerveux, peut provoquer une faiblesse des muscles de la langue, de la bouche et de la gorge, ce qui a conduit certains victimes à perdre complètement leur discours.

Dans les années qui ont suivi son diagnostic, Ezekiel, du nord de Londres, a pu utiliser une technologie de génération d'ordinateurs et de voix pour l'aider à communiquer, bien qu'une voix qui ne ressemblait à la sienne.

Elle a également pu continuer sa carrière en tant qu'artiste utilisant un curseur d'ordinateur pour créer ses images.

Mais ses deux enfants, Aviva et Eric, ont grandi sans jamais savoir comment leur mère avait parlé une fois.

Ces dernières années, les experts ont de plus en plus pu utiliser la technologie pour créer des versions informatisées de la voix d'origine d'une personne.

Mais la technique a généralement nécessité des enregistrements de longue et de bonne qualité, et même alors, il avait tendance à produire des voix qui, tout en sonnant quelque chose comme la victime, étaient « très plates et monotones », a déclaré Simon Poole de la société de communication médicale britannique SmartBox.

Poole a déclaré à l'AFP que l'entreprise avait à l'origine demandé à Ezekiel une heure d'audio.

Les personnes qui devraient perdre leur capacité à parler en raison de conditions comme MND sont actuellement encouragées à enregistrer leur voix dès que possible pour préserver leur « identité » parallèlement à leur capacité à communiquer.

Mais à l'ère pré-smartphone, avoir des enregistrements appropriés à tirer était beaucoup moins courant.

Quand Ezekiel ne pouvait localiser qu'un seul clip de très court et mauvaise qualité, Poole a déclaré que son « cœur avait coulé ».

'Presque pleuré'

Le clip d'une vidéo domestique des années 1990 ne faisait que huit secondes, étouffé et avec un bruit de fond d'une télévision.

Poole s'est tourné vers la technologie développée par les experts de la voix AI basés à New York Elevenlabs qui peuvent produire non seulement une voix basée sur très peu, mais peuvent également le faire ressembler davantage à un véritable être humain.

Il a utilisé un outil d'IA pour isoler un échantillon de voix du clip et un deuxième outil – formé sur de vraies voix pour combler les lacunes – pour produire le son final.

Le résultat, pour le délice d'Ezekiel, était très proche de son original, avec son accent de Londres et le léger lisp qu'elle avait une fois détesté.

« Je lui ai envoyé des échantillons et elle m'a écrit un e-mail en disant qu'elle avait presque pleuré quand elle l'a entendu », a déclaré Poole.

« Elle a dit qu'elle l'avait joué à une amie qui la connaissait avant qu'elle ne perde sa voix et c'était comme avoir sa propre voix », a-t-il ajouté.

Selon la Royaume-Uni Motor Neurone Disease Association, huit personnes sur 10 subissent des difficultés vocales après le diagnostic.

Mais le timing, la hauteur et le ton des voix générées par ordinateur actuelles « peuvent être assez robotiques ».

« La véritable avancée avec cette nouvelle technologie d'IA est que les voix sont vraiment humaines et expressives, et elles ramenent vraiment cette humanité dans la voix qui sonnait auparavant un peu informatisé », a déclaré Poole.

Personnaliser une voix était un moyen de préserver « l'identité » de quelqu'un « , a-t-il ajouté.

« Surtout si vous acquérez une condition plus tard dans la vie, et que vous avez perdu votre voix, pouvoir parler en utilisant votre voix d'origine est vraiment assez important, plutôt que d'utiliser une voix sur le plateau », a-t-il déclaré.