Apprentissage automatique médié par le moment cinétique orbital pour un codage de mode et de fonctionnalité de haute précision

Apprentissage automatique médié par le moment cinétique orbital pour un codage de mode et de fonctionnalité de haute précision

par Light Publishing Center, Institut d’optique, de mécanique fine et de physique de Changchun, CAS

En tant que produit dérivé des réseaux de neurones artificiels, ChatGPT est devenu extrêmement populaire en 2023, battant le record de temps le plus court pour que les utilisateurs de produits technologiques dépassent les 100 millions. Il s’agit d’un modèle linguistique à grande échelle basé sur l’apprentissage automatique (apprentissage profond), dans lequel l’apprentissage des règles linguistiques à partir de textes saisis massivement joue un rôle important.

Diverses tâches telles que la traduction de texte, la reconnaissance d’images et la compréhension du langage naturel peuvent être réalisées en utilisant ChatGPT via une pré-formation. Par rapport à l’électronique, les photons présentent d’énormes avantages en termes d’efficacité énergétique, de parallélisme (capacité de calcul) et de latence minimale ; Ainsi, les réseaux de neurones optiques (ONN) ont récemment été largement utilisés pour parvenir à un apprentissage automatique plus efficace.

Les informations contenues dans les ONN sont véhiculées par différentes dimensions physiques de la lumière telles que l’espace, la longueur d’onde, l’amplitude et la phase. Le moment cinétique orbital (OAM), en tant que dimension unique de la lumière, a déjà été largement utilisé dans les systèmes de traitement optique de l’information allant de la communication optique à l’imagerie numérique en spirale en passant par la communication quantique pour améliorer la capacité d’information en raison de l’orthogonalité infinie des états OAM. Cependant, il n’a jamais été adopté dans les ONN pour représenter des informations en raison du manque de capacité à extraire les caractéristiques de l’information dans le domaine OAM.

Dans un nouvel article publié dans Lumière : science et applicationsune équipe de scientifiques, dirigée par le professeur Min Gu et le professeur Xinyuan Fang de l’Institut des puces photoniques de l’Université de Shanghai pour les sciences et technologies, a développé une nouvelle architecture ONN utilisant le protocole d’apprentissage automatique médié par l’OAM, dans lequel l’OAM photonique sert comme signaux des nœuds du réseau neuronal.

Les caractéristiques des données des images sont apprises dans le domaine OAM, ce qui conduit à un codage intelligent de haute précision des images dans un ou plusieurs états OAM spécifiques. Le codage OAM intelligent d’images peut coopérer avec différents dispositifs de détection/démultiplexage OAM pour réaliser diverses tâches de traitement d’informations OAM, telles que la classification d’images, la transmission sécurisée d’images en espace libre avec un débit élevé et une faible latence, et la détection d’anomalies optiques.

La réalisation des caractéristiques des données d’apprentissage des images dans le domaine OAM est basée sur un réseau neuronal convolutif (CNN) basé sur la diffraction et composé de deux parties principales. La première partie est la partie de convolution, qui utilise la convolution entre le spectre de mode OAM d’une image avec une impulsion de dispersion de mode OAM entraînable pour densifier les peignes de mode OAM d’entrée et extraire les caractéristiques de mode.

La deuxième partie est un bloc de classification constitué de couches de diffraction entraînables à ouverture finie en cascade, qui peuvent réaliser une compression des caractéristiques de mode. Autrement dit, il contrôle la large distribution du spectre OAM (qui contient les caractéristiques de mode de l’image) à travers différentes pertes diffractives de divers modes OAM et aboutit finalement à la sortie d’un ou de quelques états OAM spécifiques, obtenant ainsi un OAM de caractéristique de mode. codage. L’impulsion de dispersion de mode et la distribution de phase des couches de diffraction sont généralement entraînées par un apprentissage multitâche sur la cible des modes OAM de sortie requis.

Les scientifiques résument le principe de fonctionnement de leur CNN en déclarant : « Les données brutes d’entrée dans le domaine spatial des images doivent être transformées en domaine OAM pour représenter de nombreux peignes en mode OAM. Mais la plupart des termes à coefficients d’amplitude non nuls dans ces peignes en mode OAM se concentrent sur les composants du mode OAM d’ordre inférieur qui indiquent une fonctionnalité d’informations OAM clairsemée avec des points communs sous-jacents. C’est la principale difficulté dans l’extraction des informations sur les fonctionnalités OAM.

« Inspirés par les CNN qui améliorent la précision des prédictions en insérant un bloc d’extraction de caractéristiques basé sur la convolution avant la classification, nous construisons un CNN dans le domaine OAM pour surmonter le problème de l’extraction précise des caractéristiques OAM. Par conséquent, la complexité paramétrique des données de grande dimension (images par exemple) peuvent être considérablement réduits par CNN après avoir abstrait les caractéristiques OAM des données d’entrée sous leur forme brute.

Ils ont testé leur codage OAM intelligent avec une tâche de classification consistant à distinguer 10 types de chiffres manuscrits (dans la base de données MNIST) en 10 modes OAM individuels. La précision de la classification a atteint 96 %. Cette technique de codage OAM a également été introduite dans les systèmes de communication optique sans fil. L’équipe a codé trois types d’images de T-shirts, de pantalons et de bottines (dans la base de données Fashion-MNIST) dans les trois modes OAM les plus lourds avec une précision de 93,3 % pour la transmission des informations.

Ils ont découvert que cette méthode de codage possède une capacité anti-écoute extrêmement élevée, car le décalage latéral inhérent de l’écoute clandestine (par rapport au récepteur de communication) peut directement conduire à une mesure inexacte du mode OAM (échec de l’écoute clandestine). En combinant en outre le codage OAM mode-caractéristique avec un hologramme de multiplexage OAM comme système de décodage, ils ont démontré un affichage d’image commutable de bout en bout, qui est une communication sans fil avec tous les codage, transmission et affichage d’informations optiques.

De plus, ils ont vérifié la fonction de réduction de dimension entièrement optique des images pour la détection anormale. Dans cette fonction, des images « BUS » et des images « SUV » ont été utilisées pour entraîner le CNN afin d’obtenir une sortie spécifique d’une distribution d’états de mode OAM superposée, séparément. Il est intéressant de noter que lorsque des images anormales (d’autres graphiques n’appartenant pas à ces deux catégories) sont entrées dans le réseau, elles occupent des distributions de mode OAM différentes avec les deux distributions « BUS » et « SUV », de sorte qu’elles peuvent être trouvées avec une étiquette anormale. .

Discutant de la signification physique et du développement futur de cette technique, les scientifiques observent : « Nous proposons un mécanisme universel pour convertir les caractéristiques des données en états OAM via tout l’apprentissage automatique optique, qui peut réaliser une transformation libre de toute information dans la dimension OAM. nouvelle porte pour le codage OAM intelligent de bases de données et d’images spécifiques à la vitesse de la lumière et briser le goulot d’étranglement de la réduction de la dimensionnalité optique dans le domaine OAM, qui devrait jouer un rôle énorme dans les futurs domaines de l’optique haute capacité et haute sécurité réseau neuronal pour diverses tâches de vision industrielle.

Fourni par Light Publishing Center, Changchun Institute of Optics, Fine Mechanics And Physics, CAS