Une étude teste le potentiel de deux algorithmes d’apprentissage automatique quantique pour la classification des logiciels malveillants
Au cours des dernières décennies, les cyber-attaquants sont devenus de plus en plus habiles à compromettre les systèmes et à contourner les mesures de sécurité. Par conséquent, la détection et l’identification précise des logiciels malveillants constituent un défi pressant pour de nombreuses entreprises et particuliers dans le monde.
Les experts en cybersécurité ont récemment exploré le potentiel des techniques d’apprentissage automatique pour classer les logiciels malveillants et déterminer les mesures à prendre pour les éradiquer. Alors que certaines de ces techniques ont obtenu des résultats prometteurs, des études ont montré que beaucoup d’entre elles peuvent être trompées ou ne pas identifier avec précision les logiciels malveillants qu’elles n’ont jamais rencontrés auparavant.
Dans l’espoir d’identifier des méthodes plus fiables pour classer les logiciels malveillants, des chercheurs d’Orange Innovation Inc. ont récemment mené une étude évaluant le potentiel de la version quantique des algorithmes d’apprentissage automatique. Leur article, prépublié sur arXivoffre un premier aperçu des forces et des limites de deux types de modèles d’apprentissage automatique quantique, décrivant des directions qui pourraient être explorées dans les futures recherches sur la cybersécurité.
« Je travaille sur l’utilisation de l’intelligence artificielle pour l’analyse des logiciels malveillants depuis 2019 », a déclaré Tony Quertier, co-auteur de l’article, à Tech Xplore. « Avec Grégoire Barrué, qui a débuté son post-doc en octobre, nous voulons explorer ce que la technologie quantique peut apporter à ce problème. Comme nous avons tous les deux une formation mathématique dans deux domaines complémentaires, nous espérons pouvoir mettre à profit notre apport théorique connaissances pour comprendre ce sujet. »
Quertier et Barrué pensent que l’apprentissage automatique quantique pourrait permettre aux utilisateurs d’extraire plus d’informations à partir de moins de données. Pour tester cette hypothèse dans le contexte de la classification des logiciels malveillants, ils ont jusqu’à présent évalué les performances de deux modèles d’apprentissage automatique quantique différents, appelés QSVM et QNN.
« Le premier algorithme que nous avons testé est un simple QSVM, une adaptation de l’algorithme Support Vector Machines en quantique », explique Quertier. « Nous avons ensuite également testé un QNN, une adaptation quantique d’un réseau de neurones classique. Nous trouvons les résultats très encourageants, car nous les avons entraînés sur peu de données et avec, pour le moment, deux approches d’optimisation assez simples (SPSB et data reuploading). »
Dans les premières évaluations qu’ils ont effectuées, Quertier et Barrué ont constaté que l’algorithme QSVM obtenait des résultats très prometteurs, surpassant certaines des SVM classiques de l’équipe pour la classification des logiciels malveillants sur plusieurs paramètres. Le QNN, en revanche, qui n’était optimisé qu’avec le rechargement des données et l’utilisation d’une technique connue sous le nom de SPSB, pouvait classer les logiciels malveillants avec une précision de 87 %. C’est assez bon, étant donné qu’il a également été formé sur une quantité limitée de données.
« Évidemment, cette précision n’est pas aussi bonne que nos versions classiques de l’algorithme, mais nos versions classiques sont entraînées sur 1 million de données, alors qu’ici nous n’avons utilisé que 1 000 échantillons », a déclaré Quertier. « Pour une première approche, c’est au-delà de ce que nous attendions. Pour moi, la chose la plus intéressante est la capacité des techniques d’apprentissage automatique quantique à apprendre à partir de données d’entraînement limitées. Nous sommes devenus trop dépendants d’avoir beaucoup de données et de ressources informatiques. Cependant , dans certains domaines, il n’est pas si facile d’avoir beaucoup de données. »
L’objectif primordial des efforts de recherche en cours de Quertier et Barrué est d’optimiser les algorithmes afin qu’ils puissent extraire efficacement une plus grande quantité d’informations à partir d’une quantité limitée de données. Dans leurs prochaines études, ils prévoient d’explorer le potentiel d’autres versions quantiques d’algorithmes d’apprentissage automatique, tels que les réseaux convolutionnels quantiques (RCQC), tout en utilisant également les mathématiques pour optimiser et mieux analyser les données disponibles.
« Par exemple, la théorie de Lie peut nous permettre d’identifier le nombre de paramètres pour réaliser une surparamétrisation (lorsque le modèle a suffisamment de paramètres pour que la matrice d’information de Fisher atteigne son rang maximal, et donc ait une capacité maximale) ou même d’identifier des symétries dans les données. et adapter les portes quantiques que nous utilisons », a ajouté Quertier. « En octobre 2023, une thèse de doctorat débutera sur ce sujet, qui sera dirigée par Daniel Juteau, spécialiste de ce sujet. [type of] mathématiques. »