Découvrir les motifs de la nature à l’échelle atomique en couleurs vivantes
Le codage couleur rend les cartes aériennes beaucoup plus faciles à comprendre. Grâce à la couleur, nous pouvons dire en un coup d’œil où se trouve une route, une forêt, un désert, une ville, une rivière ou un lac.
En collaboration avec plusieurs universités, le laboratoire national d’Argonne du Département américain de l’énergie (DOE) a mis au point une méthode pour créer des graphiques à code couleur de grands volumes de données à partir d’analyses par rayons X. Ce nouvel outil utilise le tri informatique des données pour trouver des clusters liés à des propriétés physiques, telles qu’une distorsion atomique dans une structure cristalline. Il devrait accélérer considérablement les recherches futures sur les changements structurels à l’échelle atomique induits par les variations de température.
L’équipe de recherche a publié ses conclusions dans le Actes de l’Académie nationale des sciences dans un article intitulé « Exploiter l’apprentissage automatique interprétable et non supervisé pour traiter les mégadonnées de la diffraction des rayons X moderne ».
« Notre méthode utilise l’apprentissage automatique pour analyser rapidement d’immenses quantités de données issues de la diffraction des rayons X », a déclaré Raymond Osborn, physicien principal de la division Science des matériaux d’Argonne. « Ce qui aurait pu nous prendre des mois dans le passé prend maintenant environ un quart d’heure, avec des résultats beaucoup plus fins. »
Depuis plus d’un siècle, la diffraction des rayons X (ou XRD) est l’une des méthodes scientifiques les plus fructueuses pour l’analyse des matériaux. Il a fourni des informations clés sur la structure atomique 3D d’innombrables matériaux technologiquement importants.
Au cours des dernières décennies, la quantité de données produites dans les expériences XRD a considérablement augmenté dans de grandes installations telles que l’Advanced Photon Source (APS), une installation utilisateur du DOE Office of Science à Argonne. Cependant, les méthodes d’analyse qui peuvent faire face à ces immenses ensembles de données manquent cruellement.
L’équipe appelle sa nouvelle méthode X-ray Temperature Clustering, ou XTEC en abrégé. Il accélère les découvertes de matériaux grâce au regroupement rapide et au codage couleur de grands ensembles de données de rayons X pour révéler des changements structurels précédemment cachés qui se produisent lorsque la température augmente ou diminue. Un grand ensemble de données typique serait de 10 000 gigaoctets, ce qui équivaut à environ 3 millions de chansons de musique en streaming.
XTEC s’appuie sur la puissance de l’apprentissage automatique non supervisé, en utilisant des méthodes développées pour ce projet à l’Université Cornell. Ce machine learning ne dépend pas d’une formation initiale et d’un apprentissage avec des données déjà bien étudiées. Au lieu de cela, il apprend en trouvant des modèles et des clusters dans de grands ensembles de données sans une telle formation. Ces motifs sont ensuite représentés par un code couleur.
« Par exemple, XTEC pourrait attribuer le rouge au groupe de données un, qui est associé à une certaine propriété qui change avec la température d’une manière particulière », a déclaré Osborn. « Ensuite, le groupe deux serait bleu et associé à une autre propriété avec une dépendance à la température différente, et ainsi de suite. Les couleurs indiquent si chaque groupe représente l’équivalent d’une route, d’une forêt ou d’un lac sur une carte aérienne. »
Dans le cadre d’un test, XTEC a analysé les données de la ligne de lumière 6-ID-D de l’APS, extraites de deux matériaux cristallins supraconducteurs à des températures proches du zéro absolu. A cette température ultrabasse, ces matériaux passent à un état supraconducteur, n’offrant aucune résistance au courant électrique. Plus important pour cette étude, d’autres caractéristiques inhabituelles émergent à des températures plus élevées liées à des changements dans la structure du matériau.
En appliquant XTEC, l’équipe a extrait une quantité sans précédent d’informations sur les changements de structure atomique à différentes températures. Celles-ci incluent non seulement des distorsions dans l’arrangement ordonné des atomes dans le matériau, mais également des fluctuations qui se produisent lorsque de tels changements se produisent.
« Grâce à l’apprentissage automatique, nous sommes en mesure de voir le comportement des matériaux non visible par XRD conventionnel », a déclaré Osborn. « Et notre méthode est applicable à de nombreux problèmes de mégadonnées non seulement dans les supraconducteurs, mais aussi dans les batteries, les cellules solaires et tout appareil sensible à la température. »
L’APS subit une mise à niveau massive qui augmentera la luminosité de ses faisceaux de rayons X jusqu’à 500 fois. La mise à niveau s’accompagnera d’une augmentation significative des données collectées à l’APS, et les techniques d’apprentissage automatique seront essentielles pour analyser ces données en temps opportun.