Lors de la création d’une IA, est-ce que plus simple est mieux ? De nouvelles recherches remettent en question les hypothèses
Lorsqu’elle tente de résoudre des problèmes, l’intelligence artificielle utilise souvent des réseaux de neurones pour traiter les données et prendre des décisions d’une manière qui imite le cerveau humain.
Dans ses dernières recherches, Sadamori Kojaku, professeur adjoint à l’Université de Binghamton, remet en question une hypothèse fondamentale dans les cercles de l’IA : selon laquelle les réseaux neuronaux plus complexes sont toujours meilleurs.
Le document, publié dans Communications naturellesmontre que les réseaux neuronaux simples peuvent trouver des communautés dans des réseaux complexes avec une optimalité théorique, remettant en question l'opinion commune selon laquelle les modèles plus complexes surpassent les modèles plus simples.
« Ce que nous avons découvert, c'est que la formation compte, pas l'architecture de programmation elle-même », a déclaré Kojaku, qui a rejoint le corps professoral de l'École de science des systèmes et de génie industriel du Thomas J. Watson College of Engineering and Applied Science à l'automne 2023.
« Il existe de nombreuses façons d'enseigner un réseau neuronal, mais nous avons constaté que l'une des meilleures méthodes d'enseignement est l'apprentissage contrastif, dans lequel vous présentez des données réelles et de fausses données afin que le réseau neuronal soit entraîné à différencier les deux. Cette formation simple permet d'obtenir des performances optimales. »
Comprendre le fonctionnement de l’IA est fondamental pour établir la confiance lorsqu’elle prend des décisions dans des domaines critiques tels que les soins de santé ou les réseaux électriques.
À l’heure actuelle, le chemin exact utilisé par les IA pour tirer leurs conclusions se trouve à l’intérieur de ce que les programmeurs appellent une « boîte noire ». La saisie de données conduit à un résultat, mais le cheminement entre ces points peut être mystérieux.
« Notre travail déballe les réseaux neuronaux et tente ensuite d'interpréter leur fonctionnement pour garantir que ce réseau neuronal fonctionne de manière optimale pour cette tâche spécifique », a déclaré Kojaku. « C'est notre premier travail qui tente de marteler la boîte noire. »
Les professeurs Filippo Radicchi, Yong-Yeol Ahn et Santo Fortunato de l'Université d'Indiana, où Kojaku a travaillé comme chercheur postdoctoral après avoir obtenu son doctorat, ont également contribué à l'article. à l'Université d'Hokkaido au Japon et avant de venir à Binghamton.