Les agents d'IA imitent la collaboration scientifique pour générer des hypothèses fondées sur des preuves

Les agents d'IA imitent la collaboration scientifique pour générer des hypothèses fondées sur des preuves

L’élaboration d’une hypothèse de recherche unique et prometteuse est une compétence fondamentale pour tout scientifique. Cela peut aussi prendre du temps : nouveau doctorat. les candidats peuvent passer la première année de leur programme à essayer de décider exactement ce qu'ils souhaitent explorer dans leurs expériences. Et si l’intelligence artificielle pouvait aider ?

Les chercheurs du MIT ont créé un moyen de générer et d’évaluer de manière autonome des hypothèses de recherche prometteuses dans tous les domaines, grâce à une collaboration homme-IA. Dans un nouvel article, ils décrivent comment ils ont utilisé ce cadre pour créer des hypothèses fondées sur des preuves qui correspondent aux besoins de recherche non satisfaits dans le domaine des matériaux d'inspiration biologique.

Publié dans Matériaux avancésl'étude a été co-écrite par Alireza Ghafarollahi, postdoctorant au Laboratoire de mécanique atomique et moléculaire (LAMM), et Markus Buehler, professeur Jerry McAfee en ingénierie dans les départements de génie civil et environnemental et de génie mécanique du MIT et directeur de LAMM.

Le cadre, que les chercheurs appellent SciAgents, se compose de plusieurs agents d'IA, chacun doté de capacités spécifiques et d'un accès aux données, qui exploitent des méthodes de « raisonnement graphique », dans lesquelles les modèles d'IA utilisent un graphe de connaissances qui organise et définit les relations entre divers concepts scientifiques. L’approche multi-agents imite la façon dont les systèmes biologiques s’organisent en groupes de blocs de construction élémentaires.

Buehler note que ce principe « diviser pour régner » est un paradigme important en biologie à plusieurs niveaux, des matériaux aux essaims d'insectes en passant par les civilisations – autant d'exemples où l'intelligence totale est bien supérieure à la somme des capacités des individus.

« En utilisant plusieurs agents d'IA, nous essayons de simuler le processus par lequel les communautés de scientifiques font des découvertes », explique Buehler. « Au MIT, nous faisons cela en réunissant un groupe de personnes d'horizons différents qui travaillent ensemble et se croisent dans des cafés ou dans l'Infinite Corridor du MIT. Mais c'est très fortuit et lent. Notre quête est de simuler le processus de découverte en explorant si les systèmes d'IA peuvent être créatifs et faire des découvertes.

Automatiser les bonnes idées

Comme l'ont démontré les développements récents, les grands modèles de langage (LLM) ont montré une capacité impressionnante à répondre à des questions, à résumer des informations et à exécuter des tâches simples. Mais ils sont assez limités lorsqu’il s’agit de générer de nouvelles idées à partir de zéro. Les chercheurs du MIT voulaient concevoir un système permettant aux modèles d’IA d’effectuer un processus en plusieurs étapes plus sophistiqué qui va au-delà du rappel des informations apprises pendant la formation, pour extrapoler et créer de nouvelles connaissances.

Le fondement de leur approche est un graphe de connaissances ontologiques, qui organise et établit des liens entre divers concepts scientifiques. Pour réaliser les graphiques, les chercheurs alimentent un ensemble d’articles scientifiques dans un modèle d’IA génératif.

Dans des travaux antérieurs, Buehler a utilisé un domaine mathématique connu sous le nom de théorie des catégories pour aider le modèle d'IA à développer des abstractions de concepts scientifiques sous forme de graphiques, ancrées dans la définition des relations entre les composants, d'une manière qui pourrait être analysée par d'autres modèles via un processus appelé raisonnement graphique. . Cela concentre les modèles d’IA sur le développement d’une manière plus fondée sur des principes de comprendre les concepts ; cela leur permet également de mieux généraliser entre les domaines.

« C'est vraiment important pour nous de créer des modèles d'IA axés sur la science, car les théories scientifiques sont généralement ancrées dans des principes généralisables plutôt que dans un simple rappel de connaissances », explique Buehler. « En concentrant les modèles d'IA sur la « pensée » de cette manière, nous pouvons aller au-delà des méthodes conventionnelles et explorer des utilisations plus créatives de l'IA. »

Pour l'article le plus récent, les chercheurs ont utilisé environ 1 000 études scientifiques sur des matériaux biologiques, mais Buehler affirme que les graphiques de connaissances pourraient être générés en utilisant beaucoup plus ou moins d'articles de recherche dans n'importe quel domaine.

Une fois le graphique établi, les chercheurs ont développé un système d'IA pour la découverte scientifique, avec plusieurs modèles spécialisés pour jouer des rôles spécifiques dans le système. La plupart des composants ont été construits à partir des modèles de la série ChatGPT-4 d'OpenAI et ont utilisé une technique connue sous le nom d'apprentissage en contexte, dans laquelle les invites fournissent des informations contextuelles sur le rôle du modèle dans le système tout en lui permettant d'apprendre à partir des données fournies.

Les agents individuels du cadre interagissent les uns avec les autres pour résoudre collectivement un problème complexe qu’aucun d’entre eux ne serait en mesure de résoudre seul. La première tâche qui leur est confiée est de générer l’hypothèse de recherche. Les interactions LLM commencent après qu'un sous-graphe a été défini à partir du graphe de connaissances, ce qui peut se produire de manière aléatoire ou en saisissant manuellement une paire de mots-clés discutés dans les articles.

Dans ce cadre, un modèle de langage que les chercheurs ont nommé « Ontologue » est chargé de définir les termes scientifiques dans les articles et d'examiner les liens entre eux, étoffant ainsi le graphe de connaissances.

Un modèle nommé « Scientifique 1 » élabore ensuite une proposition de recherche basée sur des facteurs tels que sa capacité à découvrir des propriétés inattendues et des nouveautés. La proposition comprend une discussion des résultats potentiels, de l'impact de la recherche et une hypothèse sur les mécanismes d'action sous-jacents.

Un modèle « Scientist 2 » développe l'idée, suggère des approches expérimentales et de simulation spécifiques et apporte d'autres améliorations. Enfin, un modèle « Critique » met en évidence ses forces et ses faiblesses et suggère de nouvelles améliorations.

« Il s'agit de constituer une équipe d'experts qui ne pensent pas tous de la même manière », explique Buehler. « Ils doivent penser différemment et avoir des capacités différentes. L'agent critique est délibérément programmé pour critiquer les autres, donc tout le monde n'est pas d'accord et ne dit pas que c'est une excellente idée. Vous avez un agent qui dit : « Il y a une faiblesse ici, pouvez-vous le faire ? » tu l'expliques mieux ? Cela rend le résultat très différent de celui des modèles uniques. »

D'autres agents du système sont capables de rechercher la littérature existante, ce qui fournit au système un moyen non seulement d'évaluer la faisabilité, mais également de créer et d'évaluer la nouveauté de chaque idée.

Rendre le système plus fort

Pour valider leur approche, Buehler et Ghafarollahi ont construit un graphe de connaissances basé sur les mots « soie » et « gourmand en énergie ». En utilisant ce cadre, le modèle « Scientist 1 » a proposé d'intégrer de la soie à des pigments à base de pissenlit pour créer des biomatériaux aux propriétés optiques et mécaniques améliorées. Le modèle prédit que le matériau serait nettement plus résistant que les matériaux en soie traditionnels et nécessiterait moins d’énergie pour être traité.

Le scientifique 2 a ensuite fait des suggestions, telles que l'utilisation d'outils spécifiques de simulation de dynamique moléculaire pour explorer la façon dont les matériaux proposés interagiraient, ajoutant qu'une bonne application pour le matériau serait un adhésif bio-inspiré. Le modèle Critic a ensuite mis en évidence plusieurs points forts du matériau proposé et les domaines à améliorer, tels que son évolutivité, sa stabilité à long terme et les impacts environnementaux de l'utilisation de solvants. Pour répondre à ces préoccupations, le critique a suggéré de mener des études pilotes pour valider les processus et d'effectuer des analyses rigoureuses de la durabilité des matériaux.

Les chercheurs ont également mené d’autres expériences avec des mots-clés choisis au hasard, qui ont produit diverses hypothèses originales sur des puces microfluidiques biomimétiques plus efficaces, améliorant les propriétés mécaniques des échafaudages à base de collagène et sur l’interaction entre le graphène et les fibrilles amyloïdes pour créer des dispositifs bioélectroniques.

« Le système a pu proposer ces nouvelles idées rigoureuses basées sur le cheminement du graphe de connaissances », explique Ghafarollahi.

« En termes de nouveauté et d'applicabilité, les matériaux semblaient robustes et nouveaux. Dans les travaux futurs, nous allons générer des milliers, voire des dizaines de milliers, de nouvelles idées de recherche, puis nous pourrons les catégoriser, essayer de mieux comprendre comment ces idées les matériaux sont générés et comment ils pourraient être améliorés davantage.

À l’avenir, les chercheurs espèrent intégrer de nouveaux outils pour récupérer des informations et exécuter des simulations dans leurs cadres. Ils peuvent également facilement remplacer les modèles de base de leurs frameworks par des modèles plus avancés, permettant au système de s'adapter aux dernières innovations en matière d'IA.

« En raison de la manière dont ces agents interagissent, une amélioration d'un modèle, même légère, a un impact énorme sur les comportements globaux et les résultats du système », explique Buehler.

Depuis la publication d'une prépublication contenant des détails open source sur leur approche, les chercheurs ont été contactés par des centaines de personnes intéressées par l'utilisation de ces cadres dans divers domaines scientifiques et même dans des domaines tels que la finance et la cybersécurité.

« Il y a beaucoup de choses que vous pouvez faire sans avoir à aller au laboratoire », explique Buehler. « En gros, vous voulez vous rendre au laboratoire à la toute fin du processus. Le laboratoire coûte cher et prend beaucoup de temps. Vous voulez donc un système capable d'approfondir les meilleures idées, de formuler les meilleures hypothèses et de prédire avec précision les idées émergentes. «