La programmation de la propagation de la lumière crée des réseaux neuronaux très efficaces

Les modèles d’intelligence artificielle actuels utilisent des milliards de paramètres pouvant être entraînés pour accomplir des tâches difficiles. Cependant, ce grand nombre de paramètres a un coût élevé. La formation et le déploiement de ces énormes modèles nécessitent un immense espace mémoire et des capacités informatiques qui ne peuvent être fournies que par des centres de données de la taille d’un hangar dans des processus qui consomment une énergie équivalente aux besoins en électricité des villes de taille moyenne.

La communauté des chercheurs s’efforce actuellement de repenser à la fois le matériel informatique associé et les algorithmes d’apprentissage automatique afin de maintenir durablement le développement de l’intelligence artificielle à son rythme actuel. La mise en œuvre optique des architectures de réseaux de neurones est une voie prometteuse en raison de la faible consommation des connexions entre les unités.

Nouvelle recherche rapportée dans Photonique avancée combine la propagation de la lumière à l’intérieur de fibres multimodes avec un petit nombre de paramètres programmables numériquement et obtient les mêmes performances sur les tâches de classification d’images avec des systèmes entièrement numériques avec plus de 100 fois plus de paramètres programmables. Ce cadre informatique rationalise les besoins en mémoire et réduit le besoin de processus numériques énergivores, tout en atteignant le même niveau de précision dans une variété de tâches d’apprentissage automatique.

Le cœur de ces travaux, dirigés par les professeurs Demetri Psaltis et Christophe Moser de l’EPFL (Ecole polytechnique fédérale de Lausanne), réside dans le contrôle précis d’impulsions ultracourtes au sein de fibres multimodes grâce à une technique connue sous le nom de mise en forme du front d’onde. Cela permet la mise en œuvre de calculs optiques non linéaires avec des microwatts de puissance optique moyenne, franchissant ainsi une étape cruciale dans la réalisation du potentiel des réseaux de neurones optiques.

« Dans cette étude, nous avons découvert qu’avec un petit groupe de paramètres, nous pouvons sélectionner un ensemble spécifique de poids modèles dans la banque de poids fournie par l’optique et l’utiliser pour la tâche informatique ciblée. De cette façon, nous avons utilisé des phénomènes naturels comme un matériel informatique sans se donner la peine de fabriquer et d’exploiter un appareil spécialisé à cet effet », déclare Ilker Oguz, co-auteur principal de l’ouvrage.

Ce résultat marque un pas important vers la résolution des défis posés par la demande croissante de modèles d’apprentissage automatique plus vastes. En exploitant la puissance de calcul de la propagation de la lumière à travers des fibres multimodes, les chercheurs ont ouvert la voie à des solutions matérielles d’intelligence artificielle à faible consommation d’énergie et très efficaces.

Comme le montre l’expérience d’optique non linéaire rapportée, ce cadre informatique peut également être utilisé pour programmer efficacement différents phénomènes non linéaires de grande dimension afin d’effectuer des tâches d’apprentissage automatique et peut offrir une solution transformatrice à la nature gourmande en ressources des modèles d’IA actuels.