Comment l'intelligence artificielle peut apprendre des souris

La capacité de prédire avec précision les mouvements est essentiel non seulement pour les humains et les animaux, mais aussi pour de nombreuses applications d'IA, de la conduite autonome à la robotique. Des chercheurs de l'Université technique de Munich (TUM) ont maintenant découvert que les réseaux de neurones artificiels peuvent mieux accomplir cette tâche lorsqu'elles sont formées avec des données biologiques du développement des premiers systèmes visuels.

L'étude est publiée dans Biologie informatique PLOS.

Que ce soit chez la souris, les chats ou les humains: avant même que les vertébrés ouvrent les yeux, un programme d'entraînement intégré commence dans la rétine – entièrement indépendant des stimuli externes. Les modèles d'activité spontanée se propagent dans des mouvements en forme d'onde à travers le tissu neural de l'œil.

Cette activité neuronale, connue sous le nom de «vagues rétiniennes», coordonne le câblage précoce entre la rétine et le système visuel du cerveau. D'une certaine manière, l'œil commence à pratiquer la vision avant de rencontrer le monde réel.

Des chercheurs de TUM ont maintenant montré que les réseaux de neurones artificiels – qui imitent la fonction du cerveau – peuvent également bénéficier de ce type de pré-formation.

« Les réseaux de neurones artificiels sont généralement formés à l'aide de données qui ressemblent étroitement à la tâche qu'ils sont destinés à effectuer. Lorsqu'ils sont consultés en analogie avec la façon dont le système visuel se développe dans les organismes vivants, leur processus d'apprentissage commence uniquement lorsque les yeux s'ouvrirent. Neuroscience à TUM.

La pré-formation mène à des prédictions plus rapides et plus précises

Dans la première étape, l'équipe a étudié si la formation avec des vagues de rétine a un impact sur les performances d'un réseau neuronal. Pour ce faire, ils ont formé différents réseaux de différentes manières: un groupe de réseaux a subi une pré-formation en utilisant des données d'ondes rétiniennes d'une souris.

Ensuite, ces réseaux ont été formés à l'aide d'un film d'animation simulant la perspective d'une souris qui traverse un couloir étroit bordé de divers motifs géométriques. Un autre groupe de réseaux a été formé en utilisant uniquement le film d'animation – sans aucune formation.

La tâche était la même pour tous les réseaux: ils devaient prédire avec précision comment les motifs visuels sur la paroi du couloir simulé allaient évoluer. Les réseaux pré-formés avec des ondes rétiniennes ont effectué la tâche plus rapidement et plus précisément que celles sans pré-formation.

Pour exclure la possibilité que la meilleure performance soit simplement due à une période de formation plus longue, les chercheurs ont mené une autre série d'expériences dans lesquelles ils ont raccourci le temps passé à former les réseaux pré-formés sur l'animation. Cela a assuré que tous les réseaux avaient la même durée globale de formation. Même alors, les réseaux pré-formés ont surpassé les autres à la fois en vitesse et en précision.

Dans une dernière étape, l'équipe a augmenté le niveau de difficulté. Ils ont formé les réseaux en utilisant des images réelles capturées du point de vue d'un chat itinérant avec une caméra d'action, montrant ce que le chat voit.

La qualité vidéo était plus faible que dans l'animation, et les mouvements étaient plus complexes. Encore une fois, les réseaux qui avaient été pré-formés par des vagues rétiniens ont surpassé tous les autres.