Tirer parti de la photonique en silicium pour un matériel d'IA évolutif et durable

Tirer parti de la photonique en silicium pour un matériel d’IA évolutif et durable

L’émergence de l’IA a profondément transformé de nombreuses industries. Poussée par les technologies d’apprentissage en profondeur et les mégadonnées, l’IA nécessite une puissance de traitement significative pour la formation de ses modèles. Bien que l’infrastructure d’IA existante repose sur des unités de traitement graphique (GPU), les demandes de traitement substantielles et les dépenses énergétiques associées à son fonctionnement restent les principaux défis. L’adoption d’une infrastructure d’IA plus efficace et plus durable ouvre la voie à faire progresser le développement de l’IA à l’avenir.

Une étude récente publiée dans le IEEE Journal of Selected Topics in Quantum Electronics Démontre une nouvelle plate-forme d’accélération d’IA basée sur des circuits intégrés photoniques (PIC), qui offrent une évolutivité supérieure et une efficacité énergétique par rapport aux architectures conventionnelles basées sur GPU.

L’étude, dirigée par le Dr Bassem Tossoun, un chercheur principal chez Hewlett Packard Labs, montre comment les photos tirent parti des semi-conducteurs composés III-V peuvent exécuter efficacement les charges de travail d’IA. Contrairement au matériel d’IA traditionnel qui repose sur des réseaux de neurones distribués électroniques (DNN), les accélérateurs de l’IA photonique utilisent des réseaux de neurones optiques (ONN), qui fonctionnent à la vitesse de la lumière avec une perte d’énergie minimale.

« Bien que la photonique en silicium soit facile à fabriquer, ils sont difficiles à mettre à l’échelle pour des circuits intégrés complexes. Notre plate-forme d’appareil peut être utilisée comme blocs de construction pour les accélérateurs photoniques avec une efficacité énergétique et une évolutivité beaucoup plus importantes que la pointe actuelle », explique le Dr Tossoun.

L’équipe a utilisé une approche d’intégration hétérogène pour fabriquer le matériel. Cela comprenait l’utilisation de la photonique de silicium ainsi que des semi-conducteurs composés III-V qui intègrent fonctionnellement des lasers et des amplificateurs optiques pour réduire les pertes optiques et améliorer l’évolutivité.

Les semi-conducteurs III-V facilitent la création de photos avec une plus grande densité et une plus grande complexité. Les photos utilisant ces semi-conducteurs peuvent exécuter toutes les opérations requises pour prendre en charge les réseaux de neurones, ce qui en fait des candidats principaux pour le matériel d’accélérateur d’IA de nouvelle génération.

Tirer parti de la photonique en silicium pour un matériel d'IA évolutif et durable

La fabrication a commencé avec des plaquettes de silicium sur isolant (SOI) qui ont une couche de silicium de 400 nm d’épaisseur. La lithographie et la gravure sèche ont été suivies par le dopage pour les dispositifs de condensateurs semi-conducteurs à l’oxyde métallique (MOSCAP) et les photodiodes d’avalanche (APD).

Ensuite, une croissance sélective du silicium et du germanium a été réalisée pour former des couches d’absorption, de charge et de multiplication de l’APD. Les semi-conducteurs composés III-V (tels que INP ou GAAS) ont ensuite été intégrés sur la plate-forme de silicium en utilisant la liaison die-to-wafer. Une fine couche d’oxyde de porte (al₂o₃ ou hfo₂) a été ajoutée pour améliorer l’efficacité de l’appareil, et enfin une couche diélectrique épaisse a été déposée pour l’encapsulation et la stabilité thermique.

« La plate-forme hétérogène III / V-on-SOI fournit tous les composants essentiels nécessaires pour développer des architectures informatiques photoniques et optoélectroniques pour l’accélération AI / ML. Ceci est particulièrement pertinent pour les accélérateurs photoniques analogiques ML, qui utilisent des valeurs analogiques continues pour la représentation des données », note le Dr Tosnoun.

Cette plate-forme photonique unique peut obtenir une intégration à l’échelle de la plaquette de tous les différents appareils nécessaires pour construire un réseau neuronal optique sur une seule puce photonique, y compris des appareils actifs tels que des lasers et des amplificateurs sur puce, des photodétecteurs à haute vitesse, des modulateurs économes et économes et des décalants de phase non volatils. Cela permet le développement d’accélérateurs à base de tonnes avec une efficacité d’énergie d’empreinte qui est 2,9 × 10² supérieure à celle des autres plates-formes photoniques et 1,4 × 10² de plus que l’électronique numérique la plus avancée.

Il s’agit en effet d’une technologie révolutionnaire pour l’accélération d’IA / ML, de réduction des coûts énergétiques, d’amélioration de l’efficacité de calcul et de permettre de futures applications axées sur l’IA dans divers domaines. À l’avenir, cette technologie permettra aux centres de données d’accueillir plus de charges de travail d’IA et de résoudre plusieurs problèmes d’optimisation.

La plate-forme relèvera des défis informatiques et énergétiques, ouvrira la voie à un matériel d’accélérateur IA robuste et durable à l’avenir.

Fourni par l’Institut des ingénieurs électriques et électroniques