Comment la photonique révolutionne les réseaux de neurones convolutifs
À l’ère moderne, il y a eu une croissance explosive de la demande de puissance de calcul pour le traitement cognitif d’images et de vidéos. Alors que les réseaux de neurones convolutifs offrent des performances améliorées pour le traitement des images, ils s’accompagnent également d’une augmentation significative de la consommation d’énergie et des besoins en mémoire.
Selon une enquête menée par OpenAI, la période entre 2012 et 2018 a vu une augmentation vertigineuse du nombre de calculs par un facteur supérieur à 300 000. En revanche, au cours de la même période, la loi de Moore n’a représenté qu’une multiplication par sept de la puissance de calcul.
Pour répondre à ce besoin croissant de puissance de calcul, les chercheurs se sont tournés vers la photonique comme moyen d’améliorer les réseaux de neurones convolutifs. Une équipe de chercheurs de l’Université de la mer Égée, de l’Université de l’Attique occidentale et de l’Université technique nationale d’Athènes a fourni un aperçu complet du paysage en évolution rapide des architectures neuromorphiques photoniques intégrées pour la mise en œuvre de réseaux de neurones convolutifs.
Leur article de synthèse a été publié dans Informatique intelligente.
Pourquoi l’informatique photonique est-elle nécessaire pour les réseaux de neurones convolutifs ?
Les réseaux de neurones convolutifs sont une classe de réseaux de neurones artificiels qui ont révolutionné divers domaines, en particulier les tâches de vision par ordinateur telles que la reconnaissance d’images, la détection d’objets et la segmentation d’images. Les réseaux de neurones convolutifs s’inspirent du mécanisme de traitement visuel du cerveau humain et sont conçus pour apprendre automatiquement des représentations hiérarchiques à partir des données d’entrée.
Lorsque les réseaux de neurones convolutifs sont approfondis et ont plus de paramètres entraînables, leurs performances ont tendance à s’améliorer. Cependant, cette amélioration a un coût. La consommation d’énergie et les besoins en mémoire augmentent également de manière significative. Dans le domaine du traitement d’images, les étages de convolution des réseaux de neurones convolutifs consomment environ 80% de la puissance totale consommée.
Pour répondre à la demande croissante, les entreprises et les chercheurs essaient d’utiliser plusieurs puces et de tirer parti du traitement parallèle. Cependant, cette approche conduit à une augmentation significative de la consommation d’énergie, ce qui soulève des préoccupations à la fois en termes de coûts financiers et d’impact écologique lors de la mise à l’échelle des systèmes.
Comment fonctionne l’informatique photonique ?
La photonique exploite les propriétés uniques de la lumière pour transmettre et traiter l’information, révolutionnant des applications telles que la communication de données. Les réseaux de neurones convolutifs photoniques intégrés sont un moyen d’accélérer les calculs dans les réseaux de neurones convolutifs à l’aide de dispositifs optiques spéciaux.
L’astuce consiste à transformer l’étape de convolution dans un réseau neuronal convolutif en une série de multiplications matricielles. Dans cette méthode, l’image est divisée en petits patchs et chaque patch est transformé en une ligne dans une matrice. Les filtres ou noyaux utilisés dans la convolution sont représentés sous forme de colonnes dans une autre matrice, chaque colonne contenant les poids d’un noyau. Le résultat convolutif est obtenu en effectuant une multiplication matricielle entre ces deux matrices.
En photonique intégrée, un processus similaire est employé mais avec de la lumière. Les patchs d’image sont convertis en un signal optique et les poids du noyau sont stockés dans une puce spéciale. Le signal optique est envoyé dans la puce, et à l’intérieur de la puce, il passe par un processus qui effectue la multiplication matricielle à l’aide de la lumière. Cette puce est conçue spécifiquement pour ces calculs et s’apparente à un mini ordinateur pour la lumière. Il existe différents types de ces puces, mais elles utilisent toutes la lumière pour effectuer les calculs.
Ces puces sont appelées circuits intégrés photoniques. Certains circuits intégrés photoniques sont reprogrammables, ce qui signifie qu’ils peuvent être modifiés pour effectuer différents calculs. D’autres sont fixes et conçus pour des tâches spécifiques.
Comment l’informatique photonique accélère-t-elle les réseaux de neurones convolutifs ?
Une façon d’accélérer le traitement d’image à l’aide de la lumière est l’approche de découpage du spectre optique. Imaginez une machine capable d’analyser très rapidement des images en les décomposant en différentes couleurs et motifs. Cette machine n’a pas besoin de circuits compliqués ni de prétraitement des images avant de les analyser. La méthode utilise des filtres spéciaux qui séparent l’image en différentes parties en fonction de leurs couleurs et de leurs motifs. Ces filtres fonctionnent ensemble pour extraire les caractéristiques importantes de l’image.
En utilisant cette approche, la machine devient évolutive, ce qui signifie qu’elle peut gérer des images plus grandes et plus complexes. Cette méthode consomme très peu d’énergie, car elle n’a besoin que d’une petite quantité d’énergie pour détecter la lumière et traiter les signaux. Il fonctionne également instantanément, sans délai, de sorte qu’il peut traiter les images en temps réel.
Un autre accélérateur photonique suit une approche bioisomorphe en utilisant des neurones laser miniaturisés et un entraînement bioinspiré non supervisé. Cette architecture profonde offre une solution résistante au bruit et économe en énergie. Les neurones laser simulent le comportement de pointe des neurones biologiques, offrant une robustesse contre le bruit. La formation bio-inspirée non supervisée extrait de manière autonome des caractéristiques significatives des données, permettant la reconnaissance de formes sans étiquettes explicites.
Le traitement de l’information basé sur la photonique offre une efficacité énergétique. En tirant parti de ces technologies, l’accélérateur atteint une résistance au bruit et une consommation d’énergie réduite. En résumé, l’approche alternative combine des neurones laser à pointes miniaturisés, une formation bioinspirée non supervisée et la photonique pour créer une solution d’apprentissage en profondeur économe en énergie et résistante au bruit.
Fourni par l’informatique intelligente