L’IA générative est-elle mauvaise pour l’environnement ? Un informaticien explique l’empreinte carbone de ChatGPT et de ses cousins
L’IA générative est la nouvelle technologie en vogue derrière les chatbots et les générateurs d’images. Mais à quel point fait-il chaud sur la planète ?
En tant que chercheur en intelligence artificielle, je m’inquiète souvent des coûts énergétiques liés à la construction de modèles d’intelligence artificielle. Plus l’IA est puissante, plus elle consomme d’énergie. Que signifie l’émergence de modèles d’IA génératifs de plus en plus puissants pour l’empreinte carbone future de la société ?
« Génératif » fait référence à la capacité d’un algorithme d’IA à produire des données complexes. L’alternative est l’IA « discriminative », qui choisit entre un nombre fixe d’options et ne produit qu’un seul nombre. Un exemple de résultat discriminant est le choix d’approuver ou non une demande de prêt.
L’IA générative peut créer des sorties beaucoup plus complexes, comme une phrase, un paragraphe, une image ou même une courte vidéo. Il a longtemps été utilisé dans des applications comme les haut-parleurs intelligents pour générer des réponses audio, ou en saisie semi-automatique pour suggérer une requête de recherche. Cependant, ce n’est que récemment qu’il a acquis la capacité de générer un langage humain et des photos réalistes.
Utiliser plus de puissance que jamais
Le coût énergétique exact d’un seul modèle d’IA est difficile à estimer et comprend l’énergie utilisée pour fabriquer l’équipement informatique, créer le modèle et utiliser le modèle en production. En 2019, des chercheurs ont découvert que la création d’un modèle d’IA génératif appelé BERT avec 110 millions de paramètres consommait l’énergie d’un vol transcontinental aller-retour pour une personne.
Le nombre de paramètres fait référence à la taille du modèle, les modèles plus grands étant généralement plus qualifiés. Les chercheurs ont estimé que la création du GPT-3, beaucoup plus grand, qui compte 175 milliards de paramètres, a consommé 1 287 mégawattheures d’électricité et généré 552 tonnes d’équivalent en dioxyde de carbone, soit l’équivalent de 123 véhicules de tourisme à essence conduits pendant un an. Et c’est juste pour préparer le modèle au lancement, avant que les consommateurs ne commencent à l’utiliser.
La taille n’est pas le seul prédicteur des émissions de carbone. Le modèle BLOOM en libre accès, développé par le projet BigScience en France, est de taille similaire à GPT-3 mais a une empreinte carbone beaucoup plus faible, consommant 433 MWh d’électricité pour générer 30 tonnes de CO2eq. Une étude de Google a révélé que pour la même taille, l’utilisation d’une architecture de modèle et d’un processeur plus efficaces et d’un centre de données plus écologique peut réduire l’empreinte carbone de 100 à 1 000 fois.
Les modèles plus grands consomment plus d’énergie lors de leur déploiement. Il existe peu de données sur l’empreinte carbone d’une seule requête d’IA générative, mais certains chiffres du secteur estiment qu’elle est quatre à cinq fois supérieure à celle d’une requête de moteur de recherche. À mesure que les chatbots et les générateurs d’images deviennent plus populaires, et que Google et Microsoft intègrent des modèles de langage d’IA dans leurs moteurs de recherche, le nombre de requêtes qu’ils reçoivent chaque jour pourrait augmenter de façon exponentielle.
Robots IA pour la recherche
Il y a quelques années, peu de personnes en dehors des laboratoires de recherche utilisaient des modèles tels que BERT ou GPT. Cela a changé le 30 novembre 2022, lorsque OpenAI a publié ChatGPT. Selon les dernières données disponibles, ChatGPT a enregistré plus de 1,5 milliard de visites en mars 2023. Microsoft a intégré ChatGPT dans son moteur de recherche, Bing, et l’a rendu accessible à tous le 4 mai 2023. Si les chatbots deviennent aussi populaires que les moteurs de recherche, l’énergie les coûts de déploiement des IA pourraient vraiment s’additionner. Mais les assistants IA ont bien d’autres utilisations que la simple recherche, telles que la rédaction de documents, la résolution de problèmes mathématiques et la création de campagnes marketing.
Un autre problème est que les modèles d’IA doivent être continuellement mis à jour. Par exemple, ChatGPT n’a été formé que sur des données allant jusqu’en 2021, il ne sait donc rien de ce qui s’est passé depuis lors. L’empreinte carbone de la création de ChatGPT n’est pas une information publique, mais elle est probablement beaucoup plus élevée que celle de GPT-3. S’il devait être recréé régulièrement pour mettre à jour ses connaissances, les coûts énergétiques augmenteraient encore plus.
L’un des avantages est que demander à un chatbot peut être un moyen plus direct d’obtenir des informations que d’utiliser un moteur de recherche. Au lieu d’obtenir une page pleine de liens, vous obtenez une réponse directe comme vous le feriez d’un humain, en supposant que les problèmes de précision sont atténués. Accéder plus rapidement à l’information pourrait potentiellement compenser l’augmentation de la consommation d’énergie par rapport à un moteur de recherche.
Voies à suivre
L’avenir est difficile à prédire, mais les grands modèles d’IA génératifs sont là pour rester, et les gens se tourneront probablement de plus en plus vers eux pour obtenir des informations. Par exemple, si un élève a besoin d’aide pour résoudre un problème de mathématiques maintenant, il demande à un tuteur ou à un ami, ou consulte un manuel. À l’avenir, ils demanderont probablement à un chatbot. Il en va de même pour les autres connaissances spécialisées telles que les conseils juridiques ou l’expertise médicale.
Bien qu’un seul grand modèle d’IA ne va pas ruiner l’environnement, si un millier d’entreprises développent des robots d’IA légèrement différents à des fins différentes, chacun utilisé par des millions de clients, la consommation d’énergie pourrait devenir un problème. Des recherches supplémentaires sont nécessaires pour rendre l’IA générative plus efficace. La bonne nouvelle est que l’IA peut fonctionner avec des énergies renouvelables. En amenant le calcul là où l’énergie verte est plus abondante, ou en programmant le calcul aux moments de la journée où l’énergie renouvelable est plus disponible, les émissions peuvent être réduites d’un facteur de 30 à 40, par rapport à l’utilisation d’un réseau dominé par les combustibles fossiles.
Enfin, la pression sociétale peut être utile pour inciter les entreprises et les laboratoires de recherche à publier les empreintes carbone de leurs modèles d’IA, comme certains le font déjà. À l’avenir, les consommateurs pourraient peut-être même utiliser ces informations pour choisir un chatbot « plus vert ».