Le modèle d'IA identifie les électrolytes de batterie hautes performances à partir de seulement 58 points de données

Le modèle d'IA identifie les électrolytes de batterie hautes performances à partir de seulement 58 points de données

Dans un monde idéal, un modèle d’IA recherchant de nouveaux matériaux pour construire de meilleures batteries serait formé sur des millions, voire des centaines de millions de points de données.

Mais pour les nouvelles chimies de batteries de nouvelle génération qui ne s’appuient pas sur des décennies de recherche, attendre de nouvelles études prend un temps que le monde n’a pas.

« Chaque expérience prend plusieurs semaines, voire plusieurs mois, pour obtenir des points de données », a déclaré Ritesh Kumar, boursier postdoctoral Schmidt AI in Science de la Pritzker School of Molecular Engineering (UChicago PME) de l'Université de Chicago. « Il est tout simplement impossible d'attendre d'avoir des millions de données pour entraîner ces modèles. »

Kumar est le co-premier auteur d'un article publié dans Communications naturelles qui a construit un modèle d'apprentissage actif capable d'explorer un espace de recherche virtuel d'un million d'électrolytes de batterie potentiels à partir de seulement 58 points de données. A partir de ces données minimales, l'équipe du laboratoire d'UChicago PME Asst. Le professeur Chibueze Amanchukwu a identifié quatre nouveaux solvants électrolytiques distincts qui rivalisent en termes de performances avec les électrolytes de pointe.

Pour aider à affiner les données de ce petit ensemble, l’équipe a incorporé des expériences comme résultats, testant réellement les composants de la batterie suggérés par l’IA, puis réinjectant ces résultats dans l’IA pour un affinement ultérieur.

« Souvent dans la littérature, nous considérons les proxys informatiques comme un résultat, mais il existe toujours une différence entre un proxy informatique et une expérience du monde réel. Nous avons donc mordu la balle et sommes allés jusqu'aux expériences comme résultat final », a-t-il déclaré. « Si le modèle suggérait : « D'accord, allez chercher un électrolyte dans cet espace chimique », alors nous avons en fait construit une batterie avec cet électrolyte, et nous avons fait un cycle de batterie pour obtenir les données. L'expérience ultime qui nous intéresse est la suivante : cette batterie a-t-elle une longue durée de vie ? »

Faites confiance mais vérifiez

Demander à une IA d’extrapoler des millions de molécules potentielles à partir de seulement 58 invites peut s’avérer difficile. Plus une machine doit extrapoler, plus le risque de résultats fallacieux est grand, l’équivalent chimique d’un portrait Dall-E à six doigts ou d’un ChatGPT crachant du charabia.

« Le modèle ne sera pas très précis au départ, il comportera donc certaines prédictions, et il comportera également une incertitude associée à la prédiction », a déclaré Kumar.

Les prédictions de l'IA formée sur des millions de points de données seraient théoriquement plus fiables, c'est pourquoi l'équipe a vérifié en cours de route, testant et retestant pour trouver les électrolytes ayant la meilleure capacité de décharge.

Au total, l'équipe a mené sept campagnes d'apprentissage actif avec environ 10 électrolytes testés dans chacune avant de se concentrer sur quatre nouveaux électrolytes offrant des performances de haut niveau.

« Nous ne pouvons en aucun cas supprimer complètement l'inefficacité de l'apprentissage automatique et des modèles d'IA, mais nous devrions tirer parti de ce pour quoi ils sont bons, comme nous l'avons fait dans ce cas », a déclaré Kumar. « L'autre alternative était de faire des expériences sur l'ensemble d'un million d'électrolytes, ce qui n'était pas possible. »

Du prédictif au génératif

Un domaine d'étude possible serait de jeter ne serait-ce que les 58 points de données et de demander à une IA de créer de nouvelles molécules à partir de zéro, a déclaré le co-premier auteur Peiyuan Ma, Ph.D.

Actuellement, le modèle d'IA du laboratoire extrapole des molécules à partir de molécules existantes que d'autres chercheurs ont décrites et compilées dans des bases de données. Lâcher une IA véritablement générative sur l’immense espace chimique – potentiellement jusqu’à la puissance 10 à la puissance 60, ou une avec 60 zéros après – pourrait aboutir à de nouvelles configurations qu’aucun scientifique n’avait jamais imaginées.

« Cela signifierait que nous ne sommes plus limités par la littérature existante », a déclaré Ma. « Le modèle, en principe, peut suggérer certaines molécules qui n'existent dans aucune base de données. »

Les futurs modèles d’IA devront également évaluer les électrolytes potentiels selon plusieurs critères. Les modèles d'IA évaluent les composants de la batterie sur la base d'un facteur, généralement lié à la durée de vie, a expliqué Ma. La durée de vie est l'aspect de performance le plus important d'une batterie, mais elle est loin d'être la seule caractéristique nécessaire pour fabriquer une batterie qui serait utile et percutante dans le monde réel.

« Pour qu'un électrolyte soit commercialisé avec succès, il doit répondre à plusieurs critères, tels que la capacité de base, la sécurité et même le coût », a déclaré Ma. « Nous avons besoin de futurs modèles d'IA pour filtrer davantage le travail et extraire les meilleurs électrolytes des électrolytes les plus performants. »

Se tourner vers l’IA et l’apprentissage automatique pour trouver de nouvelles molécules peut aider à éliminer les œillères de la science, a déclaré Kumar. Il existe une tendance humaine naturelle à se concentrer sur les domaines chimiques qui ont déjà montré des résultats prometteurs plutôt que d'étudier de nouveaux domaines qui pourraient soit changer le monde, soit gaspiller du temps et des ressources.

« Nous sommes toujours partisans de ce qui est déjà à notre disposition, mais l'IA peut nous fournir un moyen de sortir de notre parti pris », a déclaré Kumar.