Explorer les détails d’une puce IA économe en énergie
Hussam Amrouch a développé une architecture prête pour l’IA qui est deux fois plus puissante que les approches informatiques en mémoire comparables. Comme le rapporte le journal Communications naturelles, le professeur de l’Université technique de Munich (TUM) applique un nouveau paradigme informatique utilisant des circuits spéciaux appelés transistors à effet de champ ferroélectriques (FeFET). D’ici quelques années, cela pourrait s’avérer utile pour l’IA générative, les algorithmes d’apprentissage profond et les applications robotiques.
L’idée de base est simple : contrairement aux puces précédentes, où seuls les calculs étaient effectués sur des transistors, celles-ci servent désormais également de lieu de stockage de données. Cela permet d’économiser du temps et de l’énergie. « En conséquence, les performances des puces sont également améliorées », explique Hussam Amrouch, professeur de conception de processeurs IA à l’Université technique de Munich (TUM). Les transistors sur lesquels il effectue des calculs et stockent des données ne mesurent que 28 nanomètres, et des millions d’entre eux sont placés sur chacune des nouvelles puces d’IA.
Les puces du futur devront être plus rapides et plus efficaces que les précédentes. Par conséquent, ils ne peuvent pas chauffer aussi rapidement. C’est essentiel pour pouvoir prendre en charge des applications telles que les calculs en temps réel lorsqu’un drone est en vol, par exemple. « De telles tâches sont extrêmement complexes et gourmandes en énergie pour un ordinateur », explique le professeur.
Puces modernes : nombreuses étapes, faible consommation d’énergie
Ces exigences clés pour une puce sont résumées mathématiquement par le paramètre TOPS/W : « téra-opérations par seconde par watt ». Cela peut être considéré comme la monnaie des puces du futur. La question est de savoir combien de milliards d’opérations (TOP) un processeur peut effectuer par seconde (S) lorsqu’il est doté d’un watt (W) de puissance.
La nouvelle puce IA, développée en collaboration entre Bosch et Fraunhofer IMPS et soutenue dans le processus de production par la société américaine GlobalFoundries, peut fournir 885 TOPS/W. Cela le rend deux fois plus puissant que les puces AI comparables, y compris une puce MRAM de Samsung. Les puces CMOS, désormais couramment utilisées, fonctionnent dans la plage de 10 à 20 TOPS/W.
L’informatique en mémoire fonctionne comme le cerveau humain
Les chercheurs ont emprunté aux humains le principe de l’architecture moderne des puces. « Dans le cerveau, les neurones gèrent le traitement des signaux, tandis que les synapses sont capables de mémoriser ces informations », explique Amrouch, décrivant comment les gens sont capables d’apprendre et de se souvenir d’interrelations complexes. Pour ce faire, la puce utilise des transistors « ferroélectriques » (FeFET).
Il s’agit d’interrupteurs électroniques qui intègrent des caractéristiques supplémentaires particulières (inversion des pôles lorsqu’une tension est appliquée) et peuvent stocker des informations même lorsqu’ils sont coupés de la source d’alimentation. De plus, ils garantissent le stockage et le traitement simultanés des données au sein des transistors.
« Nous pouvons désormais créer des chipsets très efficaces qui peuvent être utilisés pour des applications telles que l’apprentissage profond, l’IA générative ou la robotique, par exemple où les données doivent être traitées là où elles sont générées », explique Amrouch.
Les puces prêtes à être commercialisées nécessiteront une collaboration interdisciplinaire
L’objectif est d’utiliser la puce pour exécuter des algorithmes d’apprentissage profond, reconnaître des objets dans l’espace ou traiter les données des drones en vol sans décalage. Cependant, le professeur de l’Institut intégré de robotique et d’intelligence artificielle de Munich (MIRMI) du TUM estime qu’il faudra attendre quelques années avant d’y parvenir.
Il estime qu’il faudra au plus tôt trois à cinq ans avant que les premières puces en mémoire adaptées aux applications réelles soient disponibles. Cela s’explique entre autres par les exigences de sécurité de l’industrie. Pour qu’une technologie de ce type puisse être utilisée par exemple dans l’industrie automobile, il ne suffit pas qu’elle fonctionne de manière fiable. Il doit également répondre aux critères spécifiques du secteur.
« Cela souligne une fois de plus l’importance de la collaboration interdisciplinaire avec des chercheurs de diverses disciplines telles que l’informatique, l’informatique et le génie électrique », explique l’expert en matériel informatique Amrouch. Il considère cela comme une force particulière de MIRMI.