La puce photonique programmable utilise la lumière pour accélérer l'entraînement en IA et couper la consommation d'énergie

La puce photonique programmable utilise la lumière pour accélérer l’entraînement en IA et couper la consommation d’énergie

Penn Engineers a développé la première puce programmable qui peut former des réseaux de neurones non linéaires en utilisant la lumière – une percée qui pourrait considérablement accélérer l’entraînement de l’IA, réduire la consommation d’énergie et même ouvrir la voie à des ordinateurs entièrement alimentés.

Alors que les puces d’IA d’aujourd’hui sont électroniques et s’appuient sur l’électricité pour effectuer des calculs, la nouvelle puce est photonique, ce qui signifie qu’elle utilise plutôt des faisceaux de lumière. Décrit dans Photonique de la naturela puce remodèle comment la lumière se comporte pour effectuer les mathématiques non linéaires au cœur de l’IA moderne.

« Les fonctions non linéaires sont essentielles pour former des réseaux de neurones profonds », explique Liang Feng, professeur en science et ingénierie des matériaux (MSE) et en génie électrique et systèmes (ESE), et auteur principal du journal. « Notre objectif était de faire en sorte que cela se produise en photonique pour la première fois. »

La pièce manquante dans la photonique AI

La plupart des systèmes d’IA dépendent aujourd’hui des réseaux de neurones, logiciels conçus pour imiter le tissu neural biologique. Tout comme les neurones se connectent pour permettre aux créatures biologiques de penser, les réseaux de neurones relient des couches d’unités simples, ou «nœuds», permettant aux systèmes d’IA d’effectuer des tâches complexes.

Dans les systèmes artificiels et biologiques, ces nœuds ne «tirent» qu’une fois qu’un seuil est atteint – un processus non linéaire qui permet à de petits changements d’entrée de provoquer des changements de sortie plus importants et plus complexes.

Sans cette non-linéarité, l’ajout de couches ne fait rien: le système se réduit simplement à une opération linéaire unique, où les entrées sont simplement ajoutées, et aucun apprentissage réel ne se produit.

Alors que de nombreuses équipes de recherche, y compris des équipes de Penn Engineering, ont développé des puces à la lumière capables de gérer les opérations mathématiques linéaires, aucune n’a résolu le défi de représenter des fonctions non linéaires en utilisant uniquement la lumière – jusqu’à présent.

« Sans fonctions non linéaires, les puces photoniques ne peuvent pas former des réseaux profonds ou effectuer des tâches vraiment intelligentes », explique Tianwei Wu (GR’24), boursier postdoctoral de l’ESE et le premier auteur du journal.

Rethaping Light avec de la lumière

La percée de l’équipe commence par un matériel de semi-conducteur spécial qui répond à la lumière. Lorsqu’un faisceau de lumière « signal » (transportant les données d’entrée) passe à travers le matériau, un deuxième faisceau « pompe » brille d’en haut, ajustant comment le matériau réagit.

En modifiant la forme et l’intensité du faisceau de pompe, l’équipe peut contrôler la façon dont la lumière du signal est absorbée, transmise ou amplifiée, en fonction de son intensité et du comportement du matériau. Ce processus « programmes » la puce pour effectuer différentes fonctions non linéaires.

Penn Engineers d'abord pour former l'IA à LightSpeed

« Nous ne changeons pas la structure de la puce », explique Feng. « Nous utilisons la lumière elle-même pour créer des motifs à l’intérieur du matériau, ce qui remodèle ensuite la façon dont la lumière se déplace à travers. »

Le résultat est un système reconfigurable qui peut exprimer une large gamme de fonctions mathématiques en fonction du motif de pompe. Cette flexibilité permet à la puce d’apprendre en temps réel, en ajustant son comportement en fonction de la rétroaction de sa sortie.

Entraînement à la vitesse de la lumière

Pour tester le potentiel de la puce, l’équipe a utilisé la puce pour résoudre les problèmes de benchmark IA. La plate-forme a atteint une précision de plus de 97% sur une simple tâche de limite de décision non linéaire et plus de 96% sur l’ensemble de données de fleurs Iris bien connu – une norme d’apprentissage automatique.

Dans les deux cas, la puce photonique correspondait ou a surperformé les réseaux de neurones numériques traditionnels, mais a utilisé moins d’opérations et n’avait pas besoin de composants électroniques avides de puissance.

Dans un résultat frappant, seulement quatre connexions optiques non linéaires sur la puce étaient équivalentes à 20 connexions électroniques linéaires avec des fonctions d’activation non linéaires fixes dans un modèle traditionnel. Cette efficacité laisse entendre ce qui est possible à mesure que l’architecture évolue.

Contrairement aux systèmes photoniques précédents – qui sont fixés après la fabrication – la puce Penn commence comme une toile vierge. La lumière de la pompe agit comme un pinceau, dessinant des instructions reprogrammables dans le matériau.

« Il s’agit d’une véritable preuve de concept pour un ordinateur photonique programmable sur le terrain », explique Feng. « C’est un pas vers un avenir où nous pouvons entraîner l’IA à la vitesse de la lumière. »

Directions futures

Bien que les travaux actuels se concentrent sur les polynômes – une famille flexible de fonctions largement utilisées dans l’apprentissage automatique – l’équipe pense que leur approche pourrait permettre des opérations encore plus puissantes à l’avenir, telles que des fonctions exponentielles ou inverses. Cela ouvrirait la voie à des systèmes photoniques qui s’attaquent aux tâches à grande échelle comme la formation de modèles de gros langues.

En remplaçant l’électronique générateur de chaleur par des composants optiques à faible énergie, la plate-forme promet également de réduire la consommation d’énergie dans les centres de données d’IA – transformant potentiellement l’économie de l’apprentissage automatique.

« Cela pourrait être le début de l’informatique photonique comme une alternative sérieuse à l’électronique », explique Liang. « Penn est le lieu de naissance d’Eniac, le premier ordinateur numérique du monde – cette puce pourrait être la première véritable étape vers une éniac photonique. »