Les chercheurs créent un vaste ensemble de données ouvertes pour faire progresser les solutions d’IA pour le captage du carbone

Les chercheurs créent un vaste ensemble de données ouvertes pour faire progresser les solutions d’IA pour le captage du carbone

Pour éviter des impacts climatiques catastrophiques, il faut lutter contre les émissions excessives de carbone. À ce stade, réduire les émissions ne suffit pas. La capture directe de l’air, une technologie qui extrait le dioxyde de carbone de l’air ambiant, présente un grand potentiel pour aider à résoudre le problème.

Mais il y a un grand défi. Pour la technologie de capture directe de l’air, chaque type d’environnement et d’emplacement nécessite une conception spécifique et unique. Une configuration de captage direct de l’air au Texas, par exemple, serait nécessairement différente de celle de l’Islande. Ces systèmes doivent être conçus avec des paramètres précis d’humidité, de température et de débit d’air pour chaque lieu.

Aujourd’hui, Georgia Tech et Meta ont collaboré pour produire une base de données massive, rendant potentiellement plus facile et plus rapide la conception et la mise en œuvre de technologies de capture directe de l’air. La base de données open source a permis à l’équipe de former un modèle d’IA beaucoup plus rapide que les simulations chimiques existantes. Le projet, nommé OpenDAC, pourrait accélérer les solutions climatiques dont la planète a désespérément besoin.

Les recherches de l'équipe ont été publiées dans ACS Science centrale.

« Pour la capture directe de l'air, il existe de nombreuses idées sur la meilleure façon de tirer parti des flux d'air et des variations de température d'un environnement donné », a déclaré Andrew J. Medford, professeur agrégé à l'École de génie chimique et biomoléculaire (ChBE) et chercheur. auteur principal de l’article.

« Mais un problème majeur consiste à trouver un matériau capable de capturer efficacement le carbone dans les conditions spécifiques de chaque environnement. »

Leur idée était de « créer une base de données et un ensemble d'outils pour aider les ingénieurs en général, qui ont besoin de trouver le bon matériel pouvant fonctionner », a déclaré Medford. « Nous voulions utiliser l'informatique pour qu'ils ne sachent plus par où commencer et leur fournir une liste solide de matériaux à synthétiser et à essayer. »

Contenant des données de réaction pour 8 400 matériaux différents et alimenté par près de 40 millions de calculs de mécanique quantique, l’équipe estime qu’il s’agit de l’ensemble de données le plus vaste et le plus robuste de ce type.

Construire un partenariat (et une base de données)

Les chercheurs de l’équipe FAIR (Fundamental AI Research) de Meta cherchaient des moyens d’exploiter leurs prouesses en matière d’apprentissage automatique pour lutter contre le changement climatique. Ils ont opté pour le captage direct de l'air, une technologie prometteuse, et devaient trouver un partenaire possédant une expertise en chimie des matériaux en ce qui concerne le captage du carbone. Ils sont allés directement à Georgia Tech.

David Sholl, professeur au ChBE, Cecile L. et David IJ Wang, et directeur de l'Initiative de décarbonisation transformationnelle du Laboratoire national d'Oak Ridge, est l'un des plus grands experts mondiaux en matière de cadres métallo-organiques (MOF). Il s’agit d’une classe de matériaux prometteurs pour la capture directe de l’air en raison de leur structure en forme de cage et de leur capacité éprouvée à attirer et à piéger le dioxyde de carbone.

Sholl a amené Medford, spécialisé dans l'application de modèles d'apprentissage automatique aux simulations de mécanique atomistique et quantique en rapport avec la chimie, dans le projet.

Sholl, Medford et leurs étudiants ont fourni toutes les entrées pour la base de données. Étant donné que la base de données prédit les interactions MOF et la production d’énergie de ces interactions, des informations considérables étaient nécessaires.

Ils avaient besoin de connaître la structure de presque tous les MOF connus, à la fois la structure du MOF en elle-même et la structure du MOF interagissant avec le dioxyde de carbone et les molécules d'eau.

« Pour prédire ce qu'un matériau pourrait faire, vous devez savoir où se trouve chaque atome et quel est son élément chimique », a déclaré Medford. « Déterminer les entrées de la base de données représentait la moitié du problème, et c'est là que notre équipe Georgia Tech a apporté son expertise de base. »

L'équipe a profité de vastes collections de structures MOF que Sholl et ses collaborateurs avaient précédemment développées. Ils ont également créé une vaste collection de structures comportant des imperfections trouvées dans des matériaux pratiques.

La puissance de l'apprentissage automatique

Anuroop Sriram, responsable de l'ingénierie de recherche chez FAIR et premier auteur de l'article, a généré la base de données en exécutant des calculs de chimie quantique sur les entrées fournies par l'équipe de Georgia Tech. Ces calculs ont utilisé environ 400 millions d’heures CPU, soit des centaines de fois plus de calcul que ce qu’un laboratoire informatique universitaire moyen peut faire en un an.

FAIR a également formé des modèles d'apprentissage automatique sur la base de données. Une fois entraînés aux 40 millions de calculs, les modèles d’apprentissage automatique ont pu prédire avec précision comment les milliers de MOF interagiraient avec le dioxyde de carbone.

L’équipe a démontré que leurs modèles d’IA constituent de nouveaux outils puissants pour la découverte de matériaux, offrant une précision comparable aux calculs traditionnels de chimie quantique tout en étant beaucoup plus rapides. Ces fonctionnalités permettront à d’autres chercheurs d’étendre leurs travaux pour explorer de nombreux autres MOF à l’avenir.

« Notre objectif était d'examiner l'ensemble de tous les MOF connus et de trouver ceux qui attirent le plus fortement le dioxyde de carbone sans attirer d'autres composants de l'air comme la vapeur d'eau, et d'utiliser ces calculs quantiques très précis pour ce faire », a déclaré Sriram. « À notre connaissance, c'est quelque chose qu'aucune autre base de données sur le captage du carbone n'a pu faire. »

En utilisant leur propre base de données, les équipes de Georgia Tech et Meta ont identifié environ 241 MOF présentant un potentiel exceptionnellement élevé pour la capture directe de l’air.

Avancer avec impact

« Selon l'ONU et la plupart des pays industrialisés, nous devons parvenir à zéro émission nette de dioxyde de carbone d'ici 2050 », a déclaré Matt Uyttendaele, directeur de l'équipe de chimie FAIR de Meta et co-auteur de l'article.

« L'essentiel de cela doit se faire en arrêtant purement et simplement les émissions de carbone, mais nous devons également nous attaquer aux émissions de carbone historiques et aux secteurs de l'économie qui sont très difficiles à décarboner, comme l'aviation et l'industrie lourde. C'est pourquoi le CO2 les technologies d'élimination telles que la capture directe de l'air doivent être mises en service dans les 25 prochaines années.

Bien que la capture directe de l'air soit encore un domaine naissant, les chercheurs affirment qu'il est crucial que des outils révolutionnaires, comme la base de données OpenDAC mise à disposition dans l'article de l'équipe, soient en cours de développement.

« Il n'y aura pas de solution unique qui nous permettra d'atteindre zéro émission nette », a déclaré Sriram. « La capture directe de l'air a un grand potentiel, mais elle doit être considérablement développée avant que nous puissions avoir un réel impact. Je pense que la seule façon d'y parvenir est de trouver de meilleurs matériaux. »

Les chercheurs des deux équipes espèrent que la communauté scientifique se joindra à la recherche de matériaux adaptés. L'ensemble du projet de jeu de données OpenDAC est open source, des données aux modèles en passant par les algorithmes.

« J'espère que cela accélérera le développement de technologies à émissions négatives, comme la capture directe de l'air, qui n'auraient peut-être pas été possibles autrement », a déclaré Medford. « En tant qu'espèce, nous devons résoudre ce problème à un moment donné. J'espère que ce travail pourra contribuer à nous y amener, et je pense qu'il a une réelle chance d'y parvenir. »