Réseaux de neurones diffractifs enfichables basés sur des métasurfaces en cascade
Les algorithmes d’apprentissage en profondeur basés sur des réseaux de neurones artificiels modifient complètement les méthodes de traitement de l’information dans de nombreux domaines scientifiques et d’ingénierie.
Actuellement, il a été appliqué à de nombreuses tâches spécifiques, notamment la classification d’images, le cryptage d’images, la reconnaissance vocale et la traduction de langues. Cependant, avec le développement rapide des algorithmes d’intelligence artificielle, il existe une énorme contradiction entre la puissance de calcul requise par les réseaux de neurones artificiels et la puissance de calcul fournie par les puces électroniques.
Le ralentissement de la loi de Moore dans «l’ère post-Moore» et les limites de l’architecture de von Neumann ont entraîné des problèmes de consommation d’énergie et de temps élevés pour l’architecture informatique existante.
Avec les avantages d’une vitesse de calcul élevée, d’un parallélisme élevé et d’une faible consommation d’énergie pendant la transmission, les réseaux de neurones diffractifs avec la lumière comme support peuvent simuler les réseaux de neurones artificiels pour le calcul à grande vitesse, offrant une solution au problème de la puissance de calcul et de l’énergie. consommation.
Récemment, des réseaux de neurones diffractifs tout optique ont été mis en œuvre et validés dans le traitement d’images et la reconnaissance d’objets. Les réseaux de neurones diffractifs sont généralement construits par plusieurs couches diffractives, chaque structure unitaire à l’intérieur étant considérée comme un neurone, et les interconnexions entre les neurones à travers différentes couches sont réalisées par diffraction de la lumière.
Les réseaux de neurones diffractifs ont fait l’objet de nombreuses recherches dans diverses tâches, notamment la reconnaissance d’images, les opérations matricielles linéaires, les opérations logiques et la mise en forme du faisceau.
Actuellement, les réseaux de neurones diffractifs sont généralement mis en œuvre dans les bandes térahertz et micro-ondes, mais il est encore difficile de réaliser une miniaturisation de l’intégration et un manque de reconfigurabilité. Par rapport aux éléments optiques diffractifs traditionnels, les métasurfaces sont plus compactes dans la bande optique et peuvent être utilisées pour contrôler simultanément l’amplitude et la phase de la lumière en modifiant la forme, la taille et la disposition des méta-atomes à l’intérieur des métasurfaces. La mise en œuvre de réseaux de neurones diffractifs utilisant des métasurfaces permet d’obtenir des dispositifs optiques intégrés intelligents miniaturisés.
Les auteurs de l’article publié dans Avancées optoélectroniques, proposent des réseaux de neurones diffractifs enfichables (P-DNN) pour résoudre le problème de reconfigurabilité des réseaux de neurones diffractifs. Combiné avec l’algorithme d’apprentissage par transfert, les paramètres de phase des plug-ins internes peuvent être formés, et plusieurs tâches de reconnaissance, telles que la reconnaissance des chiffres manuscrits et la reconnaissance de la mode, peuvent être réalisées en commutant les composants enfichables dans les réseaux.
Comme le montre la figure 1, la couche de modulation des réseaux de neurones diffractifs enfichables peut être divisée en deux parties : la couche partagée pour le prétraitement des informations d’entrée et la couche enfichable pour la commutation de plusieurs tâches.
Les informations d’entrée sont modulées à l’aide d’un masque de forme spécifique, et la lumière incidente est focalisée sur une sous-zone de détection sur le plan de détection après avoir traversé les réseaux de neurones diffractifs enfichables, et la classification d’objet est déterminée par la distribution d’énergie. Dans le cas de plug-ins de couche partagée fixes, d’autres tâches de reconnaissance peuvent être réalisées, telles que le passage de la reconnaissance de chiffres manuscrits à la reconnaissance de mode.
Pour valider l’efficacité de la méthode proposée, l’équipe de recherche a conçu des métasurfaces en cascade à deux couches fonctionnant dans une bande proche infrarouge de 800 nm, démontrant la capacité des réseaux de neurones diffractifs enfichables pour les tâches de reconnaissance manuscrite des chiffres et de la mode. Les précisions de classification expérimentales des chiffres manuscrits et des tâches de classification des modes dépassent respectivement 91,3 % et 90,0 % (Fig.2a, b).
En analysant la distribution d’énergie dans les sous-zones de détection du plan de détection, lorsque le plug-in de couche partagée est fixe, le plug-in de chiffres manuscrits et le plug-in de mode sont utilisés respectivement, et les chiffres et modes manuscrits peuvent être identifié avec précision en fonction de la distribution d’énergie. (Fig. 2c, d).
Les réseaux de neurones diffractifs enfichables sont un modèle universel qui peut être appliqué à diverses tâches de classification, améliorant la flexibilité de la conception des réseaux tout en réduisant efficacement la consommation de ressources informatiques et le temps de formation. La bonne reconfigurabilité des réseaux de neurones diffractifs enfichables fournit une solution au problème du manque de reconfigurabilité dans les réseaux de neurones diffractifs, et l’utilisation de métasurfaces aide à réaliser l’intégration et la miniaturisation des dispositifs.
À l’avenir, les réseaux de neurones diffractifs enfichables basés sur des métasurfaces pourront être utilisés comme composants intégrés optiques pour différents systèmes d’IA fonctionnels, fournissant un calcul à faible consommation d’énergie et à grande vitesse pour des tâches spécifiques, telles que la détection d’objets en temps réel dans les systèmes de conduite autonomes et filtrage optique intelligent en imagerie microscopique.
Fourni par Compuscript Ltd