La première puce de processeur tenseur basée sur des nanotubes de carbone pourrait conduire à un traitement d'IA économe en énergie
Les outils d’intelligence artificielle (IA) et d’apprentissage automatique se sont révélés très efficaces pour s’attaquer à diverses tâches qui impliquent l’analyse de données et la réalisation de prévisions précises. Malgré leurs avantages, ces outils nécessitent des ressources de calcul importantes et, lorsqu’ils fonctionnent sur des unités de traitement existantes, ils peuvent consommer beaucoup d’énergie.
Des chercheurs de l'Université de Pékin et d'autres instituts en Chine ont récemment développé une unité de traitement tensoriel (TPU) très prometteuse basée sur des nanotubes de carbone qui pourrait être utilisée pour exécuter des algorithmes d'IA de manière plus économe en énergie. Cette puce de traitement tensoriel à base de nanotubes de carbone, présentée dans un article publié dans Électronique naturellepourrait constituer une avancée majeure sur la voie du développement de puces de nouvelle génération.
« Nous avons développé avec succès la première puce de processeur tenseur (TPU) au monde basée sur des nanotubes de carbone », a déclaré Zhiyong Zhang, co-auteur de l'étude, à Tech Xplore. « Nous avons été inspirés par le développement rapide des applications d'IA ainsi que par le TPU de Google. De ChatGPT à Sora, l'intelligence artificielle inaugure une nouvelle révolution, mais la technologie traditionnelle des semi-conducteurs à base de silicium est de plus en plus incapable de répondre aux besoins de traitement de quantités massives de données. Nous avons trouvé une solution face à ce défi mondial. »
En informatique, les réseaux systoliques sont des réseaux de processeurs qui calculent rythmiquement les données et les laissent circuler librement, de la même manière que le sang circule dans le corps humain. Zhang et ses collègues ont développé une nouvelle architecture de réseau systolique efficace utilisant des transistors à nanotubes de carbone, des transistors à effet de champ (FET) avec des canaux constitués de nanotubes de carbone au lieu de semi-conducteurs conventionnels. En s'appuyant sur cette nouvelle architecture qu'ils ont développée, ils ont créé le premier TPU à base de nanotubes de carbone au monde signalé à ce jour.
« La puce est composée de 3 000 transistors à effet de champ à nanotubes de carbone, organisés en 3*3 unités de traitement (PE) », a expliqué Zhang. « Ces 9 PE forment une architecture de réseau systolique, qui peut effectuer des opérations de convolution d'entiers à deux bits et de multiplication de matrices en parallèle. »
L'architecture à couplage étroit introduite par Zhang et ses collègues prend en charge le flux de données d'entrée systoliques. Ce flux de données à travers l'architecture réduit les opérations de lecture et d'écriture des composants de mémoire vive statique (SRAM), ce qui se traduit par des économies d'énergie importantes.
« Chaque PE reçoit les données de ses voisins en amont (en haut et à gauche), calcule indépendamment un résultat partiel en lui-même et le transmet en aval (à droite et en bas) », a déclaré Zhang. « Chaque PE est conçu pour les MAC 2 bits et la multiplication de matrices sur des entiers signés et non signés. Associé au flux de données systolique, le CNT TPU pourrait accélérer les opérations de convolution dans les applications NN. »
L'architecture système proposée par l'équipe a été soigneusement conçue pour accélérer les opérations tensorielles effectuées par les réseaux neuronaux artificiels, en passant facilement des convolutions d'entiers aux multiplications de matrices. La puce de traitement tensorielle qu'ils ont développée sur la base de cette architecture pourrait constituer une étape cruciale pour le développement de nouveaux circuits intégrés hautes performances basés sur l'électronique de faible dimension.
« Sur la base de notre puce de processeur tenseur à base de carbone, nous avons construit un réseau neuronal convolutif à cinq couches qui peut effectuer des tâches de reconnaissance d'images avec un taux de précision allant jusqu'à 88 % et une consommation d'énergie de seulement 295 μW, ce qui représente la consommation d'énergie la plus faible parmi toutes les nouvelles technologies matérielles d'accélération convolutive », a déclaré Zhang.
« Les résultats de la simulation du système montrent que le transistor à base de carbone utilisant le nœud technologique 180 nm peut atteindre 850 MHz et que l'efficacité énergétique dépasse 1TOPS/w, ce qui montre des avantages évidents par rapport aux autres technologies de dispositifs au même nœud technologique. »
Dans l’ensemble, les résultats des simulations et des tests initiaux réalisés par les chercheurs soulignent le potentiel de leur TPU à base de carbone, suggérant qu’il pourrait être bien adapté à l’exécution de modèles informatiques basés sur l’apprentissage automatique. À l’avenir, leur puce pourrait afficher une plus grande puissance de calcul et être plus économe en énergie que les dispositifs existants basés sur des semi-conducteurs.
Les efforts de cette équipe de recherche pourraient à terme contribuer à accélérer les opérations des réseaux neuronaux convolutifs tout en réduisant leur consommation d'énergie. En attendant, Zhang et ses collègues prévoient d'augmenter encore les performances, l'efficacité énergétique et l'évolutivité de leur puce.
« Les performances et l'efficacité énergétique de cette approche pourraient être encore améliorées, par exemple, en utilisant des CNT semi-conducteurs alignés comme matériaux de canal, en réduisant la taille du transistor, en augmentant le nombre de bits des PE ou en mettant en œuvre une logique CMOS », a ajouté Zhang.
« Le TPU CNT pourrait également être construit en BEOL dans une usine de silicium pour une intégration tridimensionnelle : c'est-à-dire un processeur en silicium en bas avec un TPU CNT en haut comme coprocesseur. De plus, l'intégration monolithique 3D de FET CNT multicouches pourrait être étudiée pour les avantages potentiels d'une latence réduite et d'une bande passante plus importante. »