Le modèle d'apprentissage en profondeur améliore considérablement la précision de la correspondance des sous-graphiques en éliminant le bruit

Le modèle d’apprentissage en profondeur améliore considérablement la précision de la correspondance des sous-graphiques en éliminant le bruit

Une équipe de recherche de l’Université de Kumamoto a développé un modèle prometteur d’apprentissage en profondeur qui améliore considérablement la précision de l’appariement des sous-graphiques – une tâche critique dans les domaines allant de la découverte de médicaments au traitement du langage naturel.

L’œuvre est publiée dans la revue Accès IEEE.

La correspondance des sous-graphiques implique d’identifier des modèles (ou des sous-graphiques) spécifiques dans des réseaux grands et complexes. Cependant, les réseaux de neurones graphiques conventionnels (GNN) luttent souvent avec la précision lorsque des nœuds « supplémentaires » ou non pertinents dans les données interfèrent avec le processus d’appariement.

Pour y remédier, l’équipe de l’Université de Kumamoto, dirigée par le professeur Motoki Amagasaki et le professeur adjoint Masato Kiyama de la Faculté de sciences et de technologie, a créé Endnet (réseau de décision extra-nœud) – un modèle d’IA innovant qui peut identifier et neutraliser l’influence de ces nœuds supplémentaires.

Endnet présente trois mécanismes clés:

  1. Détection d’extra-nœuds à l’aide d’une matrice d’appariement dénormalisée, qui identifie les nœuds non pertinents et supprime leur influence en définissant leurs valeurs de fonction à zéro.
  2. Propagation unidirectionnelle, un mécanisme qui aiguise présente un alignement entre la requête et les graphiques de données.
  3. Convolution graphique partagée, une nouvelle méthode de convolution utilisant les fonctions sigmoïdes pour affiner l’extraction des fonctionnalités.

Les tests sur quatre ensembles de données ouverts ont montré que EndNet surpasse les modèles existants, atteignant une précision jusqu’à 99,1% sur l’ensemble de données COX2, un bond significatif de 91,6% avec les méthodes précédentes. Des études d’ablation ont confirmé que chaque composant d’Endnet contribue à ses performances élevées.

« Endnet ouvre des possibilités passionnantes pour appliquer la correspondance des sous-graphiques aux données du monde réel comme les réseaux biologiques, les structures moléculaires et les graphiques sociaux », explique le professeur adjoint Kiyama. « Nous prévoyons également son extension à des ensembles de données plus grands à l’avenir. »

Le code source est ouvertement disponible sur GitHub, encourageant le développement ultérieur par la communauté plus large de l’IA.