Un nouveau modèle informatique de vrais neurones pourrait conduire à une meilleure IA
Presque tous les réseaux de neurones qui alimentent les outils d’intelligence artificielle modernes tels que ChatGPT sont basés sur un modèle informatique des années 1960 d’un neurone vivant. Un nouveau modèle développé au Center for Computational Neuroscience (CCN) du Flatiron Institute suggère que cette approximation vieille de plusieurs décennies ne capture pas toutes les capacités de calcul que possèdent les vrais neurones et que cet ancien modèle freine potentiellement le développement de l'IA.
Le nouveau modèle développé au CCN postule que les neurones individuels exercent plus de contrôle sur leur environnement qu'on ne le pensait auparavant. Le modèle neuronal mis à jour pourrait à terme conduire à des réseaux neuronaux artificiels plus puissants, capables de mieux capturer les pouvoirs de notre cerveau, affirment les développeurs du modèle.
Les chercheurs présentent le modèle dans un article publié dans la revue Actes de l'Académie nationale des sciences.
« Les neurosciences ont beaucoup progressé au cours de ces 60 dernières années et nous reconnaissons désormais que les modèles de neurones précédents étaient plutôt rudimentaires », déclare Dmitri Chklovskii, chef de groupe au CCN et auteur principal du nouvel article. « Un neurone est un dispositif beaucoup plus complexe et bien plus intelligent que ce modèle trop simplifié. »
Les réseaux de neurones artificiels visent à imiter la manière dont le cerveau humain traite les informations et prend des décisions, bien que de manière beaucoup plus simplifiée. Ces réseaux sont constitués de couches ordonnées de « nœuds » basées sur le modèle neuronal des années 1960. Le réseau commence par une couche d'entrée de nœuds qui reçoit les informations, puis comporte des couches intermédiaires de nœuds qui traitent les informations, puis se termine par une couche de sortie de nœuds qui envoie les résultats.
En règle générale, un nœud ne transmettra des informations à la couche suivante que si l'entrée totale qu'il reçoit des nœuds de la couche précédente dépasse un certain seuil. Lorsque les réseaux neuronaux artificiels actuels sont formés, les informations traversent un nœud dans une seule direction, et les nœuds n'ont aucun moyen d'influencer les informations qu'ils reçoivent des nœuds situés plus tôt dans la chaîne.
En revanche, le modèle récemment publié traite les neurones comme de minuscules « contrôleurs », un terme technique désignant les appareils qui peuvent influencer leur environnement en fonction des informations recueillies sur cet environnement. Nos cellules cérébrales ne sont pas de simples relais d'entrée passifs, mais elles peuvent en réalité fonctionner pour contrôler l'état de leurs collègues neurones.
Chklovskii estime que ce modèle plus réaliste d'un neurone en tant que contrôleur pourrait constituer une étape importante vers l'amélioration des performances et de l'efficacité de nombreuses applications d'apprentissage automatique.
« Même si les réalisations de l'IA sont très impressionnantes, de nombreux problèmes subsistent », dit-il. « Les applications actuelles peuvent vous donner de mauvaises réponses, voire halluciner, et les entraîner demande beaucoup d'énergie ; elles sont très coûteuses. Il y a tous ces problèmes que le cerveau humain semble éviter. Si nous devions comprendre comment le cerveau fonctionne réellement En faisant cela, nous pourrions construire une meilleure IA. »
Le modèle du neurone en tant que contrôleur a été inspiré par ce que les scientifiques comprennent des circuits à grande échelle du cerveau constitués de nombreux neurones. On pense que la plupart des circuits cérébraux sont organisés en boucles de rétroaction, dans lesquelles les cellules situées plus tard dans la chaîne de traitement influencent ce qui se passe plus tôt dans la chaîne. Tout comme un thermostat maintenant la température d'une maison ou d'un bâtiment, les circuits cérébraux doivent rester stables pour éviter de surcharger le système corporel d'activité.
Chklovskii dit qu'il n'était pas entièrement intuitif que ce type de contrôle par rétroaction puisse également être réalisé par une cellule cérébrale individuelle. Lui et ses collègues ont réalisé qu'une nouvelle forme de contrôle, connue sous le nom de contrôle direct basé sur les données, est suffisamment simple et efficace pour être biologiquement plausible et avoir lieu dans des cellules individuelles.
« Les gens pensaient que le cerveau dans son ensemble, ou même certaines parties du cerveau, était un contrôleur, mais personne n'a suggéré qu'un seul neurone pouvait faire cela », explique Chklovskii. « Le contrôle est une tâche à forte intensité de calcul. Il est difficile de penser qu'un neurone possède une capacité de calcul suffisante. »
Considérer les neurones comme des mini-contrôleurs explique également plusieurs phénomènes biologiques jusqu'alors inexpliqués, explique Chklovskii. Par exemple, on sait depuis longtemps qu'il y a beaucoup de bruit dans le cerveau, et le but de ce caractère aléatoire biologique a été débattu, mais l'équipe du CCN a découvert grâce à sa modélisation que certains types de bruit pourraient en réalité améliorer les performances des neurones.
Plus précisément, aux jonctions où un neurone se connecte à un autre (appelées « synapses »), il arrive souvent qu'un neurone transmette un signal électrique mais que le neurone couplé en aval ne reçoive pas le message. La question de savoir si et quand le neurone en aval reçoit un signal synaptique semble être largement régie par le hasard.
Alors que d'autres scientifiques ont émis l'hypothèse qu'un tel caractère aléatoire était simplement la nature des petits systèmes biologiques et n'était pas important pour le comportement des neurones, l'équipe Flatiron a découvert que l'ajout de bruit à leur neurone modèle lui permettait de s'adapter à un environnement en constante évolution. Le caractère aléatoire semble être important pour reproduire le fonctionnement des vrais neurones, a découvert l’équipe.
Chklovskii prévoit ensuite d'analyser les types de neurones qui ne correspondent pas à leur nouveau modèle. Par exemple, les neurones de la rétine reçoivent des informations directes de l’environnement visuel. Ces neurones ne sont peut-être pas capables de contrôler leurs entrées comme le peuvent les neurones situés plus profondément dans le cerveau, mais ils pourraient utiliser certains des mêmes principes identifiés par Chklovskii et son équipe : à savoir, ces neurones pourraient être capables de prédire leurs entrées, même s'ils le peuvent. Je ne les influence pas.
« Le contrôle et la prédiction sont en réalité très liés », explique Chklovskii. « Vous ne pouvez pas contrôler efficacement sans prédire l'impact de vos actions sur le monde. »
Fourni par la Fondation Simons