Exploiter la lumière pour une intelligence artificielle ultra-rapide et à faible consommation

Réseaux de neurones sur puces photoniques. Crédit : Politecnico di Milano

Les réseaux de neurones sont des structures informatiques distribuées inspirées de la structure d’un cerveau biologique et visent à atteindre des performances cognitives comparables à celles des humains mais en un temps beaucoup plus court.

Ces technologies constituent désormais la base de systèmes d’apprentissage automatique et d’intelligence artificielle capables de percevoir l’environnement et d’adapter leur propre comportement en analysant les effets des actions précédentes et en travaillant de manière autonome. Ils sont utilisés dans de nombreux domaines d’application, tels que la reconnaissance et la synthèse de la parole et des images, la conduite autonome et les systèmes de réalité augmentée, la bioinformatique, le séquençage génétique et moléculaire et les technologies de calcul haute performance.

Par rapport aux approches informatiques conventionnelles, afin d’exécuter des fonctions complexes, les réseaux de neurones doivent être initialement « formés » avec une grande quantité d’informations connues que le réseau utilise ensuite pour s’adapter en apprenant de l’expérience. La formation est un processus extrêmement énergivore et à mesure que la puissance de calcul augmente, la consommation des réseaux de neurones augmente très rapidement, doublant tous les six mois environ.

Les circuits photoniques sont une technologie très prometteuse pour les réseaux de neurones car ils permettent de construire des unités de calcul économes en énergie. Depuis des années, le Politecnico di Milano travaille au développement de processeurs photoniques programmables intégrés sur des puces en silicium de quelques mm seulement² en taille pour une utilisation dans le domaine de la transmission et du traitement des données, et maintenant ces dispositifs sont utilisés pour construire des réseaux de neurones photoniques.

« Un neurone artificiel, comme un neurone biologique, doit effectuer des opérations mathématiques très simples, comme l’addition et la multiplication, mais dans un réseau de neurones constitué de nombreux neurones densément interconnectés, le coût énergétique de ces opérations croît de façon exponentielle et devient rapidement prohibitif. Notre puce intègre un accélérateur photonique qui permet d’effectuer des calculs très rapidement et efficacement, à l’aide d’une grille programmable d’interféromètres au silicium.Le temps de calcul est égal au temps de transit de la lumière dans une puce de quelques millimètres de taille, on parle donc de moins plus d’un milliardième de seconde (0,1 nanoseconde) », déclare Francesco Morichetti, responsable du laboratoire de dispositifs photoniques du Politecnico di Milano.

« Les avantages des réseaux de neurones photoniques sont connus depuis longtemps, mais l’une des pièces manquantes pour exploiter pleinement leur potentiel était la formation au réseau. C’est comme avoir une calculatrice puissante, mais ne pas savoir s’en servir. Dans cette étude, nous avons réussi dans la mise en œuvre de stratégies d’entraînement pour les neurones photoniques similaires à celles utilisées pour les réseaux de neurones conventionnels. Le « cerveau » photonique apprend rapidement et avec précision et peut atteindre une précision comparable à celle d’un réseau de neurones conventionnel, mais plus rapidement et avec des économies d’énergie considérables. blocs pour l’intelligence artificielle et les applications quantiques », ajoute Andrea Melloni, directeur de Polifab, le centre de micro et nanotechnologie du Politecnico di Milano.

En plus des applications dans le domaine des réseaux de neurones, cet appareil peut être utilisé comme unité de calcul pour de multiples applications où une efficacité de calcul élevée est requise, par exemple, pour les accélérateurs graphiques, les coprocesseurs mathématiques, l’exploration de données, la cryptographie et les ordinateurs quantiques.

Le travail est publié dans la revue Science.