Le cryptage révolutionnaire jette les bases des modèles d'IA préservant la confidentialité

Le cryptage révolutionnaire jette les bases des modèles d’IA préservant la confidentialité

À une époque où les problèmes de confidentialité des données se profilent, une nouvelle approche de l’intelligence artificielle (IA) pourrait remodeler la façon dont les informations sensibles sont traitées.

Rechercheurs Austin Ebel et Karthik Garimella, Ph.D. Les étudiants et professeur adjoint de génie électrique et informatique Brandon Reagen ont introduit Orion, un nouveau cadre qui apporte un chiffrement entièrement homorphe (FHE) à l’apprentissage en profondeur – allant des modèles d’IA à fonctionner pratiquement et efficacement directement sur des données cryptées sans avoir besoin de les déchiffrer en premier.

Les implications de cette avancement, publiées sur le arxiv Le serveur préalable et prévu pour être présenté à la Conférence internationale de l’ACM 2025 sur la prise en charge architecturale pour les langages de programmation et les systèmes d’exploitation, sont profonds.

Fhe a longtemps été considéré comme le Saint Graal de la cryptographie. Contrairement au cryptage traditionnel, qui protège les données uniquement lorsqu’il est au repos ou en transit, FHE permet de les calculer sur des données cryptées sans jamais les décrypter. Cependant, malgré sa promesse, la mise en œuvre de modèles d’apprentissage en profondeur avec FHE a été notoirement difficile en raison de l’immense frais de calcul et des obstacles techniques à l’adaptation des réseaux de neurones au modèle de programmation sur mesure de FHE.

« Chaque fois que vous utilisez des services en ligne, il existe des modèles d’apprentissage automatique fonctionnant en arrière-plan, en collectant à la fois vos entrées et vos sorties », explique Garimella. « Cela compromet la confidentialité des utilisateurs. Notre objectif est de faire entrer dans le courant dominant et de permettre aux utilisateurs de continuer à utiliser les services sur lesquels ils comptent chaque jour sans publier leurs données privées personnelles. »

Orion relève ces défis de front avec un cadre automatisé qui convertit de manière transparente des modèles d’apprentissage en profondeur écrit en Pytorch en programmes efficaces. Il le fait en introduisant une nouvelle méthode pour optimiser la structure des données cryptées, ce qui réduit considérablement les frais généraux de calcul. Le cadre rationalise également les processus liés au chiffrement, ce qui facilite la gestion efficace du bruit accumulé et l’exécution de calculs en profondeur.

En utilisant ces techniques, Orion atteint une accélération de 2,38x par rapport aux méthodes de pointe existantes sur RESNET-20, un modèle de référence commun utilisé dans la recherche en profondeur relativement faible. Mais peut-être le plus impressionnant, Orion permet des calculs sur des réseaux beaucoup plus grands que possible. Les chercheurs ont démontré la toute première détection d’objets à haute résolution à l’aide de Yolo-V1 – un modèle d’apprentissage en profondeur avec 139 millions de paramètres, environ 500 fois plus grand que RESNET-20 – ont réussi à gérer la capacité d’Orion à gérer les charges de travail sur le monde réel.

Le code produit par l’équipe est léger et pourrait être utilisé par toute personne ayant une compréhension de base de l’informatique. Non seulement cela aiderait à augmenter l’efficacité des calculs; Il le rend également facilement déployable dans toutes les industries.

« Il y a eu une barrière incroyable à l’entrée pour les personnes qui ne veulent pas passer des mois à des années à apprendre les tenants et les aboutissants », explique Ebel. « Avec Orion, cette barrière à l’entrée est désormais presque inexistante. »

Le développement d’Orion marque une étape essentielle pour combler l’écart entre les applications d’apprentissage en profondeur pratiques. Avec ce cadre, les industries qui dépendent de la confidentialité, telles que les soins de santé, la finance et la cybersécurité, pouvaient tirer parti de l’IA sans exposer les données d’utilisateurs sensibles.

« Prenez la publicité en ligne », explique Reagen, qui est également membre du NYU Center for Cybersecurity. « Si vous souhaitez traiter les informations d’un individu afin de leur diffuser des annonces ciblées à l’aide de réseaux de neurones, cela permet aux fournisseurs de services d’analyser ces données tout en le gardant totalement confidentiel. Pour les spécialistes du marketing et le public, c’est un scénario gagnant-gagnant. »

Bien que les défis restent à rendre la grande échelle, Orion rapproche la technologie de l’adoption généralisée. L’équipe de recherche a ouvert le projet, ce qui le rend accessible aux développeurs et aux chercheurs du monde entier.

Alors que l’IA continue de s’intégrer plus profondément dans la vie quotidienne, des techniques de préservation de la vie privée comme Orion pourraient redéfinir l’équilibre entre l’innovation et la sécurité, l’informatique que les algorithmes plus intelligents ne sont pas au prix de la confidentialité des utilisateurs.