Un algorithme d'addition d'entiers pourrait réduire les besoins énergétiques de l'IA de 95 %
Une équipe d'ingénieurs de la société de technologie d'inférence d'IA BitEnergy AI rapporte une méthode permettant de réduire de 95 % les besoins énergétiques des applications d'IA. Le groupe a publié un article décrivant sa nouvelle technique sur le arXiv serveur de préimpression.
À mesure que les applications de l’IA se sont généralisées, leur utilisation a considérablement augmenté, entraînant une augmentation notable des besoins et des coûts énergétiques. Les LLM tels que ChatGPT nécessitent beaucoup de puissance de calcul, ce qui signifie que beaucoup d'électricité est nécessaire pour les faire fonctionner.
À titre d’exemple, ChatGPT nécessite désormais environ 564 MWh par jour, soit suffisamment pour alimenter 18 000 foyers américains. À mesure que la science continue de progresser et que ces applications deviennent de plus en plus populaires, les critiques ont suggéré que les applications d’IA pourraient utiliser environ 100 TWh par an dans quelques années seulement, soit un niveau comparable aux opérations minières de Bitcoin.
Dans ce nouvel effort, l'équipe de BitEnergy AI affirme avoir trouvé un moyen de réduire considérablement la quantité de calcul requise pour exécuter des applications d'IA, sans entraîner de réduction des performances.
La nouvelle technique est basique : au lieu d’utiliser la multiplication complexe à virgule flottante (FPM), la méthode utilise l’addition d’entiers. Les applications utilisent FPM pour gérer des nombres extrêmement grands ou petits, permettant aux applications d'effectuer des calculs en les utilisant avec une extrême précision. Il s’agit également de la partie la plus gourmande en énergie de l’analyse des chiffres de l’IA.

Les chercheurs appellent leur nouvelle méthode Multiplication de complexité linéaire : elle fonctionne en approximant les FPM à l’aide d’une addition d’entiers. Ils affirment que les tests effectués jusqu'à présent ont montré que la nouvelle approche réduit la demande d'électricité de 95 %.
Le seul inconvénient est qu’il nécessite un matériel différent de celui actuellement utilisé. Mais l’équipe de recherche note également que le nouveau type de matériel a déjà été conçu, construit et testé.
Cependant, la manière dont un tel matériel serait autorisé est encore floue : actuellement, le fabricant de GPU Nvidia domine le marché du matériel d'IA. La manière dont ils réagissent à cette nouvelle technologie pourrait avoir un impact majeur sur le rythme de son adoption, si les affirmations de l'entreprise sont vérifiées.