Apprendre à des robots à apprendre à d'autres robots

Équilibrer les données de formation et les connaissances humaines pour que l’IA agisse davantage comme un scientifique

Lorsque vous apprenez à un enfant à résoudre des énigmes, vous pouvez soit le laisser résoudre par essais et erreurs, soit le guider avec quelques règles et conseils de base. De même, l’intégration de règles et d’astuces dans la formation à l’IA, comme les lois de la physique, pourrait la rendre plus efficace et mieux refléter le monde réel. Cependant, aider l’IA à évaluer la valeur de différentes règles peut s’avérer une tâche délicate.

Les chercheurs rapportent le 8 mars dans la revue Lien qu'ils ont développé un cadre pour évaluer la valeur relative des règles et des données dans des « modèles d'apprentissage automatique éclairés » qui intègrent les deux. Ils ont montré que ce faisant, ils pouvaient aider l’IA à intégrer les lois fondamentales du monde réel et à mieux résoudre des problèmes scientifiques tels que la résolution de problèmes mathématiques complexes et l’optimisation des conditions expérimentales dans les expériences de chimie.

« L'intégration des connaissances humaines dans les modèles d'IA a le potentiel d'améliorer leur efficacité et leur capacité à faire des inférences, mais la question est de savoir comment équilibrer l'influence des données et des connaissances », déclare le premier auteur Hao Xu de l'Université de Pékin. « Notre cadre peut être utilisé pour évaluer différentes connaissances et règles afin d'améliorer la capacité prédictive des modèles d'apprentissage profond. »

Les modèles d'IA générative comme ChatGPT et Sora sont purement basés sur les données : les modèles reçoivent des données de formation et s'apprennent eux-mêmes par essais et erreurs. Cependant, avec uniquement des données sur lesquelles travailler, ces systèmes n'ont aucun moyen d'apprendre les lois physiques, telles que la gravité ou la dynamique des fluides, et ils ont également du mal à fonctionner dans des situations qui diffèrent de leurs données d'entraînement.

Une approche alternative est l'apprentissage automatique informé, dans lequel les chercheurs fournissent au modèle des règles sous-jacentes pour aider à guider son processus de formation, mais on sait peu de choses sur l'importance relative des règles par rapport aux données dans la précision du modèle.

« Nous essayons d'enseigner aux modèles d'IA les lois de la physique afin qu'ils reflètent davantage le monde réel, ce qui les rendrait plus utiles en science et en ingénierie », explique l'auteur principal Yuntian Chen de l'Institut oriental de technologie de Ningbo.

Pour améliorer les performances de l'apprentissage automatique éclairé, l'équipe a développé un cadre permettant de calculer la contribution d'une règle individuelle à la précision prédictive d'un modèle donné. Les chercheurs ont également examiné les interactions entre différentes règles, car la plupart des modèles d’apprentissage automatique intègrent plusieurs règles, et un trop grand nombre de règles peut entraîner l’effondrement des modèles.

Cela leur a permis d'optimiser les modèles en ajustant l'influence relative des différentes règles et de filtrer entièrement les règles redondantes ou interférentes. Ils ont également identifié certaines règles qui fonctionnaient en synergie et d’autres règles qui dépendaient entièrement de la présence d’autres règles.

« Nous avons constaté que les règles ont différents types de relations, et nous utilisons ces relations pour accélérer la formation des modèles et obtenir une plus grande précision », explique Chen.

Les chercheurs affirment que leur cadre a de vastes applications pratiques en ingénierie, en physique et en chimie. Dans cet article, ils ont démontré le potentiel de la méthode en l'utilisant pour optimiser les modèles d'apprentissage automatique afin de résoudre des équations multivariées et de prédire les résultats d'expériences de chromatographie sur couche mince et ainsi d'optimiser les futures conditions chimiques expérimentales.

Ensuite, les chercheurs prévoient de développer leur cadre en un outil plug-in pouvant être utilisé par les développeurs d’IA. En fin de compte, ils souhaitent également entraîner leurs modèles afin qu’ils puissent extraire des connaissances et des règles directement à partir des données, plutôt que de laisser des règles sélectionnées par des chercheurs humains.

« Nous voulons en faire une boucle fermée en faisant du modèle un véritable scientifique en IA », explique Chen. « Nous travaillons au développement d'un modèle capable d'extraire directement des connaissances des données, puis d'utiliser ces connaissances pour créer des règles et s'améliorer. »