Un ordinateur actif unique construit à un objectif pour les applications de science de l'IA

Un ordinateur actif unique construit à un objectif pour les applications de science de l'IA

Avec les besoins particuliers des scientifiques et des ingénieurs à l'esprit, les chercheurs du Laboratoire national du Pacifique Nord-Ouest du ministère de l'Énergie ont conçu avec Micron une nouvelle architecture matérielle-software construite pour la science.

Le système de prototype Crète offrira 15 téraoctets de mémoire active colocalisée avec les processeurs système. Cette configuration de mémoire à processeur est unique dans le complexe de laboratoire DOE et même parmi la communauté informatique haute performance dans son ensemble, selon les concepteurs de systèmes.

Il est venu en ligne le 12 août 2025 pour les utilisateurs du Doe Office of Science National Laboratory, qui peuvent postuler via la mémoire avancée pour soutenir l'initiative de l'intelligence artificielle pour la science (AMAIS) pour accéder à ce banc d'essai unique en son genre.

« Nous explorons de nouvelles technologies de mémoire pour résoudre les applications et les problèmes contraints par les lacunes de mémoire qui se manifestent sous forme de capacité, de bande passante du système ou de partage », a déclaré Andrés Márquez, le lead de l'initiative AMAIS et un informaticien PNNL qui se spécialise dans la conception de nouvelles technologies informatiques.

« Nous utilisons Calcul Express Link (CXL), une norme ouverte de l'industrie, pour connecter la mémoire avec le processeur via un commutateur d'E / S développé par XConn Technologies. »

Cette plate-forme étend les architectures existantes où la mémoire est, par conception, étroitement couplée à un ou plusieurs éléments de traitement. Le système CRETE fournit un mélange intelligent de deux types d'architectures de mémoire – couplément couplé, qui est pris en charge par un module de mémoire double en ligne enregistré en micron, ainsi que des cartes de contrôleur CXL Micron personnalisées – offrant une formidable opportunité pour l'informatique scientifique basée sur les données, y compris l'IA, selon Márquez.

La mémoire d'accès aléatoire de Crete est égale à la mémoire dans 240 ordinateurs portables haut de gamme fonctionnant avec 64 gigaoctets de mémoire s'ils fonctionnaient tous simultanément et communiquaient en temps réel.

« Le système Crète représente un bond en avant dans la redéfinition de la façon dont la mémoire et le calcul peuvent fonctionner pour débloquer la découverte scientifique », a déclaré Mark Helm, membre principal de l'équipe Pathfinding and Strategy de Micron dans le groupe Technology and Products.

« Chez Micron, nous pensons que l'avenir de la recherche axée sur l'IA dépend d'architectures qui se libérent des contraintes de mémoire actuelles. Notre collaboration avec PNNL n'est pas seulement dans le développement d'un système puissant – il s'agit de permettre une nouvelle ère d'exploration, où des environnements riches en mémoire permettent aux scientifiques de découvrir des informations approfondies pour résoudre les problèmes critiques. »

Le nouveau lit d'essai de Crète est disponible pour être utilisé par des chercheurs d'autres laboratoires nationaux et universitaires qui ont des applications qui nécessitent plus de mémoire que sur la plupart des architectures informatiques d'aujourd'hui, qui ont tendance à favoriser la vitesse de traitement par rapport à un grand accès à la mémoire.

« Pendant plusieurs décennies, la communauté HPC s'est concentrée sur les architectures de système de mémoire distribuées, et bien que de nombreuses applications puissent être partitionnées pour utiliser la mémoire qui est directement attachée aux processeurs, elle a conduit à des applications` `orphelines '' qui nécessitent une grande capacité de mémoire directement adressable », a déclaré James « Jim » Ang, scientifique en chef pour le calcul chez PNNL.

Ces applications de chimie qui intègrent l'IA sont les premiers candidats aux utilisateurs en Crète.

« Nous avons des applications de chimie informatique qui vont utiliser cet espace mémoire plus grand immédiatement », a ajouté Ang. « Nous sommes ravis de découvrir ce que Crete peut faire avec une IA générative analysant les données scientifiques, par opposition aux modèles et au texte de grande langue. »

Une salle de chat à mémoire

La nouvelle architecture de la mémoire est conçue pour offrir un espace où de grandes bases de données, des algorithmes de modélisation moléculaire et des agents d'IA peuvent se rencontrer, comme une salle de chat, pour échanger des informations en temps réel et faire des prédictions, suggérer de nouveaux chemins de recherche et analyser les résultats expérimentaux.

« Le banc d'essai de Crète nous permettra de pousser le bord d'attaque de ce que la technologie CXL est capable et de définir à quoi ressemble l'IA scientifique pour la prochaine décennie », a déclaré Márquez.

Les algorithmes Genai progressent quotidiennement et les chercheurs doivent être en mesure d'intégrer l'IA avec leur flux de travail de simulation et d'analyse des données. Crete fournira un lancement pour une nouvelle génération d'algorithmes qui accélèrent la découverte en chimie, les matériaux avancés et la biologie moléculaire.

AMaising AI pour la science

L'initiative AMAIS soutient un certain nombre de projets scientifiques et de cybersécurité pour faire progresser l'IA pour la science.

« S'appuyant sur la vision innovante du regretté informaticien Jim Gray, qui a introduit le concept de » le quatrième paradigme: la découverte scientifique à forte intensité de données « , Crete vise à présenter le potentiel de cette idée en accélérant les charges de travail scientifiques à grande échelle et à grande mémoire du projet AMAIS.

« Le mécanisme de mémoire activé par le commutateur de mémoire XConn permet à la mémoire qui se trouve à l'extérieur dans le réseau soit facilement accessible par plusieurs hôtes en même temps, passant des informations sans aller au disque dur pour les grandes charges de travail », a-t-il ajouté. « C'est un grand différenciateur. Personne d'autre ne fait ça. »

Anticipant cette co-conception de matériel de matériel, PNNL a investi dans le financement de recherche dirigé par un laboratoire pour les architectures définies par logiciel, une chaîne d'outils entièrement open source pour les accélérateurs matériels hautement spécialisés axés sur l'apprentissage automatique. Ce projet a commencé il y a plusieurs années dans l'initiative de convergence du modèle de données et sert désormais d'outil fondamental essentiel en Amais.

Les chercheurs prévoient également d'effectuer une analyse continue de la façon dont le nouveau système de mémoire fonctionne en évaluant le majeure goulot d'étranglement de HPC: accès aux données depuis le système de mémoire. L'équipe de recherche, dirigée par Nathan Tallent de PNNL, déploiera des outils d'analyse de mémoire spécialement conçus qui fournissent des informations détaillées sans nécessiter un temps, un espace et des ressources supplémentaires excessifs.

L'équipe a également intégré des défenses pour protéger le système contre la cyberattaque ou d'autres problèmes de cybersécurité.

« Nous savons qu'il y a beaucoup de vulnérabilités de cybersécurité en matière de mémoire », a déclaré Márquez. « Cela a tendance à être le talon d'Achille de tout type de système de sécurité dans le monde du calcul. Nous abordons les vulnérabilités de cybersécurité dans la phase de conception, dès le départ, dans le système. »

Prêt pour l'exascale

Le banc d'essai de Crète est conçu pour des flux de travail informatiques complexes avec une architecture système qui peut être reconfiguré en fonction des besoins.

Par exemple, une équipe de chercheurs de PNNL s'est associée étroitement à Micron pour tirer parti de la technologie CXL émergente pour la chimie informatique. Pendant le développement de la Crète, l'informaticien Ajay Panyala et le chimiste informatique Karol Kowalski ont travaillé avec l'équipe Micron pour permettre l'exachat de logiciel de chimie informatique prêt à l'Exascale pour exécuter des simulations en utilisant la mémoire CXL sur la Crète.

« Nous construisons les outils qui anticipent les superordinateurs phares de nouvelle génération commandés par les installations d'utilisateurs du DOE », a ajouté Ang. « Cet investissement comble l'écart entre l'infrastructure informatique d'aujourd'hui et ceux qui sont en ligne au cours de la prochaine décennie. »