Nouvelle puce IA d'IBM : « imite » le cerveau humain et surpasse les GPU

IBM s’inspire du cerveau humain pour concevoir son matériel d’IA et a dévoilé un nouvelle puce qui, selon la société, a une meilleure latence et est plus économe en énergie que les GPU existants.

La puce NorthPole 12 nm du géant de la technologie dispose d’une nouvelle architecture matérielle de réseau neuronal optimisée pour les tâches d’inférence neuronale, telles que la classification d’images et la détection d’objets.

IBM affirme que la puce est 25 fois plus économe en énergie et a une latence 22 fois inférieure à celle d’un GPU comparable dans le benchmark ResNet50. Ses performances sont documentées dans un article qui vient de paraître dans Science.

NorthPole IBM, une puce de 22 milliards de transistors

NorthPole possède 22 milliards de transistors et une grande mémoire sur puce, ce qui signifie qu’il peut être utilisé pour stocker et effectuer des calculs sur puce sans avoir à accéder à la mémoire externe, améliorant ainsi encore la vitesse et l’efficacité.

« L’une des plus grandes différences avec NorthPole est que toute la mémoire de l’appareil se trouve dans la puce elle-même, plutôt que d’être connectée séparément », lit-on dans un article de blog IBM. Le cerveau humain est également autonome.

La mémoire est entièrement dans la puce, qui n’a pas besoin de déplacer continuellement les données de la mémoire au traitement ou à tout autre composant de la puce. C’est ce qu’on appelle le goulot d’étranglement de von Neumann.

« Il s’agit d’un réseau complet sur une puce », explique Dharmendra Modha, scientifique en chef d’IBM pour l’informatique inspirée du cerveau, qui a développé la puce avec son équipe. Il a déclaré que NorthPole surpasse également les puces fabriquées avec des processus plus avancés, tels que les GPU 4 nm.

IBM tente également d’affiner NorthPole, par exemple en expérimentant des nœuds de pointe de 2 nm. L’état actuel de la technique en matière de processeurs est de 3 nm.

NorthPole IBM ne peut pas accéder au stockage externe

Cependant, NorthPole ne peut pas accéder à la mémoire externe, il prend donc en charge des réseaux neuronaux plus grands en les « décomposant en sous-réseaux plus petits » pour les insérer dans sa mémoire et en connectant les sous-réseaux entre eux sur différentes puces NorthPole, une technique appelée « scale-out ».

« Nous ne pouvons pas exécuter GPT-4 sur cette puce, mais nous pourrions servir de nombreux modèles dont les entreprises ont besoin », a déclaré Modha. De plus, la puce est « uniquement destinée à l’inférence ».

D’un autre côté, NorthPole peut être « approprié » pour applications de pointe qui doivent traiter d’énormes quantités de données en temps réel, comme celles des véhicules autonomes.

Lors de la conception de la puce, Modha et son équipe se sont inspirés du cerveau humain. Le NoC (réseaux sur puces) de NorthPole interconnectent les cœurs, unifiant et distribuant le calcul et la mémoire – que les chercheurs d’IBM comparent aux voies de la matière blanche à longue distance et à la matière grise à courte distance dans le cerveau.

Il existe également une intersection dense qui améliore le flux des activations neuronales au niveau local, comme la connectivité locale du cerveau qui permet de créer des voies entre les neurones des régions corticales voisines.

IBM a également essayé d’imiter la précision des synapses du cerveau, optant pour une précision en bits inférieure (deux à quatre) par rapport aux GPU traditionnels, qui utilisent des précisions en bits plus élevées (huit à 16). Ce choix a été fait pour réduire drastiquement les besoins en mémoire et en énergie.

NorthPole, les applications possibles

Il est encore tôt pour utiliser NorthPole et IBM prévoit de poursuivre ses recherches. Mais le géant de la technologie explore déjà des applications possibles.

Lors des tests, NorthPole a été largement appliqué aux cas d’utilisation liés au cloud. vision par ordinateur, car le financement du projet provenait du département américain de la Défense. De tels cas d’utilisation incluent le détection, segmentation d’images et classification vidéo.

Mais la puce a également été testée pour d’autres choses, par exemple pour le traitement du langage naturel et la reconnaissance vocale.

L’équipe matérielle explore actuellement le mappage par décodeur uniquement de grands modèles de langage pour étendre les systèmes NorthPole.

Quand on pense à ces tâches d’IA, toutes sortes de cas d’utilisation viennent à l’esprit, des véhicules autonomes à la robotique, en passant par les assistants numériques ou l’informatique spatiale. De nombreux types d’applications bord qui nécessitent de traiter d’énormes quantités de données en temps réel pourraient convenir parfaitement à NorthPole. Par exemple, il pourrait s’agir du type d’appareil nécessaire pour transformer les véhicules autonomes, passant de machines nécessitant des cartes et des itinéraires préétablis pour fonctionner à petite échelle, à des machines capables de réfléchir et de réagir aux rares situations extrêmes qui rendent la navigation dans le monde réel si difficile, même pour les conducteurs humains qualifiés.

Ces types de cas extrêmes constituent exactement la force des futures applications NorthPole. La nouvelle puce d’IBM pourrait permettre aux satellites de surveiller l’agriculture et de gérer les populations d’animaux sauvages, de suivre les véhicules et les marchandises pour des routes plus sûres et moins encombrées, de faire fonctionner des robots en toute sécurité et de détecter les cybermenaces contre les entreprises plus sûres.