Les scientifiques commencent à développer l'IA pour la découverte scientifique en utilisant la technologie derrière ChatGPT

Les scientifiques commencent à développer l’IA pour la découverte scientifique en utilisant la technologie derrière ChatGPT

Une équipe internationale de scientifiques, notamment de l’Université de Cambridge, a lancé une nouvelle collaboration de recherche qui exploitera la même technologie que ChatGPT pour créer un outil de découverte scientifique basé sur l’IA.

Tandis que ChatGPT traite des mots et des phrases, l’IA de l’équipe apprendra des données numériques et des simulations physiques de tous les domaines scientifiques pour aider les scientifiques à tout modéliser, des étoiles supergéantes au climat terrestre.

L’équipe a lancé l’initiative, appelée Polymathic AI, plus tôt cette semaine, parallèlement à la publication d’une série d’articles connexes sur le sujet. arXiv référentiel en libre accès.

« Cela va complètement changer la façon dont les gens utilisent l’IA et l’apprentissage automatique dans le domaine scientifique », a déclaré Shirley Ho, chercheuse principale de Polymathic AI, chef de groupe au Center for Computational Astrophysics du Flatiron Institute à New York.

L’idée derrière Polymathic AI « est similaire à la façon dont il est plus facile d’apprendre une nouvelle langue quand on connaît déjà cinq langues », a déclaré Ho.

Commencer avec un grand modèle pré-entraîné, appelé modèle de base, peut être à la fois plus rapide et plus précis que de créer un modèle scientifique à partir de zéro. Cela peut être vrai même si les données d’entraînement ne sont pas manifestement pertinentes pour le problème en question.

« Il a été difficile de mener des recherches universitaires sur des modèles de base à grande échelle en raison de l’ampleur de la puissance de calcul requise », a déclaré le co-chercheur Miles Cranmer, du département de mathématiques appliquées et de physique théorique et de l’institut d’astronomie de Cambridge. « Notre collaboration avec la Fondation Simons nous a fourni des ressources uniques pour commencer à prototyper ces modèles destinés à être utilisés en science fondamentale, sur lesquels les chercheurs du monde entier pourront s’appuyer – c’est passionnant. »

« L’IA polymathique peut nous montrer des points communs et des liens entre différents domaines qui auraient pu être manqués », a déclaré le co-chercheur Siavash Golkar, chercheur invité au Centre d’astrophysique computationnelle du Flatiron Institute.

« Au cours des siècles précédents, certains des scientifiques les plus influents étaient des mathématiciens possédant une vaste compréhension de différents domaines. Cela leur a permis de constater des liens qui les ont aidés à s’inspirer pour leurs travaux. Chaque domaine scientifique devenant de plus en plus spécialisé, il est Il est de plus en plus difficile de rester à l’avant-garde dans plusieurs domaines. Je pense que c’est un domaine où l’IA peut nous aider en regroupant des informations provenant de nombreuses disciplines.

L’équipe Polymathic AI comprend des chercheurs de la Fondation Simons et de son Flatiron Institute, de l’Université de New York, de l’Université de Cambridge, de l’Université de Princeton et du Laboratoire national Lawrence Berkeley. L’équipe comprend des experts en physique, astrophysique, mathématiques, intelligence artificielle et neurosciences.

Les scientifiques ont déjà utilisé des outils d’IA, mais ils ont principalement été spécialement conçus et formés à l’aide de données pertinentes.

« Malgré les progrès rapides de l’apprentissage automatique ces dernières années dans divers domaines scientifiques, dans presque tous les cas, les solutions d’apprentissage automatique sont développées pour des cas d’utilisation spécifiques et formées sur des données très spécifiques », a déclaré le co-chercheur François Lanusse, cosmologue au Centre. national de la recherche scientifique (CNRS) en France.

« Cela crée des frontières à la fois au sein et entre les disciplines, ce qui signifie que les scientifiques qui utilisent l’IA pour leurs recherches ne bénéficient pas d’informations qui peuvent exister, mais dans un format différent, ou dans un domaine totalement différent. »

Le projet de Polymathic AI apprendra en utilisant des données provenant de diverses sources en physique et en astrophysique (et éventuellement dans des domaines tels que la chimie et la génomique, disent ses créateurs) et appliquera ce sens multidisciplinaire à un large éventail de problèmes scientifiques. Le projet « reliera de nombreux sous-domaines apparemment disparates en quelque chose de plus grand que la somme de leurs parties », a déclaré Mariel Pettee, membre du projet et chercheuse postdoctorale au Laboratoire national Lawrence Berkeley.

« Il n’est pas clair jusqu’où nous pouvons faire ces sauts entre les disciplines », a déclaré Ho. « C’est ce que nous voulons faire : essayer d’y parvenir. »

ChatGPT a des limites bien connues en matière de précision (par exemple, le chatbot dit que 2 023 fois 1 234 équivaut à 2 497 582 plutôt que la bonne réponse de 2 496 382). Le projet de Polymathic AI évitera bon nombre de ces pièges, a déclaré Ho, en traitant les nombres comme de véritables nombres, et non comme de simples caractères au même niveau que les lettres et la ponctuation. Les données de formation utiliseront également de véritables ensembles de données scientifiques qui capturent la physique sous-jacente au cosmos.

La transparence et l’ouverture constituent une grande partie du projet, a déclaré Ho. « Nous voulons que tout soit rendu public. Nous voulons démocratiser l’IA pour la science de telle manière que, dans quelques années, nous serons en mesure de proposer à la communauté un modèle pré-entraîné qui pourra contribuer à améliorer les analyses scientifiques dans un large éventail de domaines. variété de problèmes et de domaines.