Prédire les propriétés des matériaux avec des données limitées
Des chercheurs de l'Institut indien des sciences (IISc), en collaboration avec des collaborateurs de l'University College de Londres, ont développé des méthodes basées sur l'apprentissage automatique pour prédire les propriétés des matériaux, même avec des données limitées. Cela peut faciliter la découverte de matériaux dotés des propriétés souhaitées, tels que les semi-conducteurs.
Ces dernières années, les ingénieurs en matériaux se sont tournés vers des modèles d'apprentissage automatique pour prédire quels types de matériaux peuvent posséder des propriétés spécifiques telles que les bandes interdites électroniques, les énergies de formation et les propriétés mécaniques, afin de concevoir de nouveaux matériaux. Cependant, les données sur les propriétés des matériaux, nécessaires à la formation de ces modèles, sont limitées car les tests de matériaux sont coûteux et prennent du temps.
Cela a incité les chercheurs dirigés par Sai Gautam Gopalakrishnan, professeur adjoint au Département de génie des matériaux de l'IISc, à travailler pour relever ce défi. Dans une nouvelle étude, ils ont trouvé un moyen efficace d’utiliser une approche d’apprentissage automatique appelée apprentissage par transfert pour prédire les valeurs de propriétés matérielles spécifiques.
Dans l'apprentissage par transfert, un grand modèle est d'abord pré-entraîné sur un grand ensemble de données, puis affiné pour s'adapter à un ensemble de données cible plus petit. « Dans cette méthode, le modèle apprend d'abord à effectuer une tâche simple comme classer les images en, disons, chats et non-chats, et est ensuite formé pour une tâche spécifique, comme classer les images de tissus entre celles contenant des tumeurs et celles ne contenant pas de tumeurs. pour le diagnostic du cancer », explique Gopalakrishnan.
Les modèles d'apprentissage automatique traitent les données d'entrée, telles qu'une image, et génèrent des sorties, comme l'identification des formes présentes dans l'image. La première couche du modèle prend en compte l'entrée d'image brute. Les couches suivantes extraient les caractéristiques de l'image, telles que les bords, qui sont progressivement affinées. Les couches finales combinent ces fonctionnalités pour reconnaître et classer les fonctionnalités de niveau supérieur, comme les formes.
Ces modèles peuvent être construits à l'aide de diverses architectures, telles que les réseaux de neurones graphiques (GNN), qui fonctionnent avec des données structurées sous forme de graphes, comme la structure cristalline tridimensionnelle de n'importe quel matériau. Dans les GNN, les informations de chaque couche sont représentées sous forme de nœuds (atomes dans une structure) et les connexions entre les nœuds sont représentées sous forme d'arêtes (liaisons entre atomes). Pour la présente étude, l’équipe de recherche a développé un modèle basé sur GNN.
L'architecture du GNN, comme le nombre de couches et la manière dont elles sont connectées, détermine la capacité du modèle à apprendre et à reconnaître les caractéristiques complexes des données. L'équipe a d'abord déterminé l'architecture optimale nécessaire pour le modèle et la taille des données d'entraînement requises pour prédire les propriétés des matériaux. Ils ont également pré-entraîné le modèle en réglant uniquement certaines couches tout en « gelant » les autres, explique Reshma Devi, premier auteur et doctorant. étudiant au Département de Génie des Matériaux.
À ce modèle optimisé et pré-entraîné, ils ont fourni des données sur les propriétés du matériau telles que la constante diélectrique et l'énergie de formation du matériau en entrée, afin que le modèle puisse prédire les valeurs de propriétés spécifiques du matériau, comme le coefficient piézoélectrique.
L’équipe a constaté que leur modèle basé sur l’apprentissage par transfert, qui a d’abord été pré-entraîné puis affiné, fonctionnait bien mieux que les modèles formés à partir de zéro. Ils ont également utilisé un cadre appelé Multi-property Pre-Training (MPT) dans lequel ils ont simultanément pré-entraîné leur modèle sur sept propriétés de matériaux 3D en vrac différentes. Remarquablement, ce modèle était également capable de prédire la valeur de la bande interdite pour les matériaux 2D sur lesquels il n'avait pas été formé.
L’équipe utilise désormais ce modèle pour prédire la rapidité avec laquelle les ions peuvent se déplacer dans les électrodes d’une batterie, ce qui peut potentiellement aider à construire de meilleurs dispositifs de stockage d’énergie.
« Cela peut également être utilisé pour fabriquer de meilleurs semi-conducteurs en prédisant leur tendance à former des défauts ponctuels, ce qui peut contribuer à l'essor de l'Inde vers la fabrication de semi-conducteurs », ajoute Gopalakrishnan.