New Chip utilise l'emprise d'IA pour réduire l'empreinte énergétique des modèles de grande langue de 50%

New Chip utilise l’emprise d’IA pour réduire l’empreinte énergétique des modèles de grande langue de 50%

Les chercheurs de l’Oregon State University College of Engineering ont développé une puce plus efficace en tant qu’antidote aux grandes quantités d’électricité consommées par des applications d’intelligence artificielle de modèle à grande langue comme les Gémeaux et le GPT-4.

« Nous avons conçu et fabriqué une nouvelle puce qui consomme la moitié de l’énergie par rapport aux conceptions traditionnelles », a déclaré le doctorant Ramin Javadi, qui, avec Tejasvi Anand, professeur agrégé de génie électrique, a présenté la technologie lors de la conférence sur les circuits intégrés personnalisés de l’IEEE à Boston.

« Le problème est que l’énergie requise pour transmettre un seul bit n’est pas réduite au même rythme que la demande de débit de données augmente », a déclaré Anand, qui dirige les circuits de signal mixtes et les systèmes Lab à OSU. « C’est ce qui fait que les centres de données utilisent autant de puissance. »

La nouvelle puce elle-même est basée sur des principes d’IA qui réduisent la consommation d’électricité pour le traitement du signal, a déclaré Javadi.

« Les modèles de grands langues doivent envoyer et recevoir d’énormes quantités de données sur des liens de communication en cuivre, en cuivre dans les centres de données, ce qui nécessite une énergie importante », a-t-il déclaré. « Une solution consiste à développer des puces de communication filaire plus efficaces. »

Lorsque les données sont envoyées à grande vitesse, explique Javadi, elle est corrompue au niveau du récepteur et doit être nettoyée. La plupart des systèmes de communication filaire conventionnels utilisent un égaliseur pour effectuer cette tâche, et les égaliseurs sont relativement avalés de puissance.

« Nous utilisons ces principes d’IA sur puce pour récupérer les données de manière plus intelligente et plus efficace en formant le classificateur sur puce pour reconnaître et corriger les erreurs », a déclaré Javadi.

Javadi et Anand travaillent sur la prochaine itération de la puce, qu’ils s’attendent à apporter de nouveaux gains d’efficacité énergétique.