Nouvelle méthode d’amélioration de la confidentialité pour les données médicales alimentées par l’IA

Nouvelle méthode d’amélioration de la confidentialité pour les données médicales alimentées par l’IA

L'intelligence artificielle a le potentiel d'améliorer la capacité des médecins à diagnostiquer et à traiter l'apnée du sommeil. Mais cette technologie n’est pas largement adoptée, car on craint qu’elle ne protège pas les données des patients.

Cela pourrait bientôt changer.

Une nouvelle étude menée par l'Université de Buffalo montre comment chiffrer en toute sécurité les données alimentées par l'IA lorsqu'elles transitent par des fournisseurs de services cloud tiers, comme Google ou Amazon, vers les médecins et leurs patients.

La méthode, qui repose sur un cryptage entièrement homomorphique (FHE), s'est avérée efficace à 99,56 % pour détecter l'apnée du sommeil à partir d'un ensemble de données d'électrocardiogramme (ECG) anonymisé disponible pour la recherche. À terme, cette technique pourrait accélérer et améliorer la détection et le traitement de l’apnée du sommeil, et être utilisée dans d’autres applications de soins de santé où la sécurisation des données est primordiale.

« Ce travail met en évidence à quel point un traitement de données sécurisé et crypté peut protéger la vie privée des patients tout en permettant des outils de diagnostic avancés basés sur l'IA. Il offre un potentiel significatif pour améliorer la sécurité des soins de santé dans le diagnostic de l'apnée du sommeil et dans d'autres domaines », a déclaré la chercheuse principale Nalini Ratha. , Ph.D., professeur SUNY Empire Innovation au Département d'informatique et d'ingénierie de l'UB.

L'étude a été présentée lors de la Conférence internationale sur la reconnaissance des formes (ICPR 2024), qui s'est tenue du 1er au 5 décembre à Calcutta, en Inde. Les co-auteurs incluent Charanjit Jutla, membre du personnel de recherche chez IBM ; Arjun Ramesh Kaushik, Ph.D. étudiant à l'UB; et les étudiants en maîtrise Tilak Sharma et Bharat Yalavarthi, tous deux récemment diplômés du programme d'informatique de l'UB.

Maximiser les bénéfices, diminuer les risques

L’IA peut profiter aussi bien aux médecins qu’aux patients, a déclaré Ratha. L'apprentissage automatique offre plusieurs avantages, notamment une analyse plus rapide et plus efficace, la capacité de traiter de grands volumes de données et la possibilité d'établir un diagnostic plus précis.

Par exemple, des algorithmes d’apprentissage profond sont entraînés pour identifier des modèles dans les signaux ECG qui indiquent des perturbations respiratoires ou une diminution des niveaux d’oxygène pendant le sommeil, caractéristiques de l’apnée du sommeil. En analysant de grandes quantités de données ECG, ces modèles peuvent apprendre à détecter des anomalies subtiles qui peuvent être difficiles à identifier pour les médecins humains, a-t-il expliqué.

Seule la diffusion des données, ainsi que des résultats du diagnostic, est troublante car elle peut porter atteinte à la vie privée des patients.

« Si un fournisseur de services cloud comme Google ou Amazon effectue une analyse de mes données, il peut potentiellement déterminer mon statut d'apnée du sommeil et commencer à m'envoyer des publicités pour acheter ceci ou cela », a-t-il déclaré. « Les fournisseurs de services cloud peuvent également avoir des accords avec d'autres sociétés pour me vendre des produits. Les informations sur l'apnée du sommeil sont uniquement destinées à mon médecin ; elles ne sont pas destinées à la consommation publique, en particulier pour générer des revenus publicitaires à partir de ma situation. »

Les compagnies d'assurance pourraient également capturer les données et potentiellement augmenter les primes des patients souffrant d'apnée du sommeil, car leurs conditions ont été révélées.

« Une fois le premier mur de confidentialité brisé, les pertes d'informations peuvent coûter cher au patient de plusieurs manières », a déclaré Ratha. « Une fois que vous avez collecté tous ces ECG sans aucune contrainte, vous pouvez essayer d'établir de nombreux liens inutiles. Si quelqu'un soumet son ECG à un fournisseur de services sur Internet, c'est là que nous intervenons. Comment pouvons-nous empêcher ces fournisseurs de services de abuser des données ? »

Traitement plus rapide et efficace des données cryptées

Les analyses basées sur FHE sont connues pour être plus lentes et plus complexes que les méthodes traditionnelles d’analyse de données non chiffrées.

Les chercheurs ont surmonté ces inconvénients en développant de nouvelles techniques qui optimisent les opérations clés d’apprentissage en profondeur, permettant ainsi au système FHE de fonctionner plus rapidement et à moindre coût.

Des exemples de ces techniques, qui englobent toutes les étapes d'un réseau neuronal profond, incluent la convolution, qui est une méthode utilisée pour détecter des modèles ; des fonctions d'activation, comme une unité linéaire rectifiée, qui aident le modèle à prendre des décisions ; le pooling, qui est utilisé pour réduire la taille des données ; et une couche entièrement connectée, qui est un réseau neuronal dans lequel chaque nœud d'entrée est connecté à chaque nœud de sortie.

Citant un exemple standard dans le domaine FHE, Ratha a utilisé une analogie avec l’or pour expliquer le fonctionnement de leur système de cryptage.

« Si vous voulez fabriquer un bijou en or, mais que vous ne voulez pas le donner directement au bijoutier parce que vous ne savez pas ce que le bijoutier va y mélanger, vous le mettez dans une boîte », a-t-il expliqué. « Le bijoutier peut toucher l'or, mais il ne pourra jamais le sortir de la boîte. La boîte est notre cryptage, les données sont l'or, et le bijoutier est l'algorithme basé sur FHE qui vient toucher les données mais ne peut pas les extraire. hors de la boîte. »

Ratha a souligné que même s'ils ont utilisé l'apnée du sommeil pour cette étude, leurs résultats pourraient s'appliquer à de nombreuses analyses à partir de données d'images radiographiques, d'IRM, de tomodensitogrammes et d'autres procédures médicales.

« Il existe de nombreuses situations où la vie privée est primordiale », a-t-il déclaré.