L’IA à la vitesse de la lumière est devenue une possibilité
Des chercheurs de l’Université Aalto ont démontré le calcul tensoriel en un seul coup à la vitesse de la lumière, une étape remarquable vers un matériel d’intelligence artificielle générale de nouvelle génération alimenté par le calcul optique plutôt que par l’électronique.
Les opérations tensorielles constituent le type d'arithmétique qui constitue l'épine dorsale de presque toutes les technologies modernes, en particulier l'intelligence artificielle, mais elles vont au-delà des simples mathématiques que nous connaissons. Imaginez les mathématiques derrière la rotation, le découpage ou la réorganisation d'un Rubik's cube selon plusieurs dimensions. Alors que les humains et les ordinateurs classiques doivent effectuer ces opérations étape par étape, la lumière peut les effectuer toutes en même temps.
Aujourd’hui, chaque tâche de l’IA, de la reconnaissance d’images au traitement du langage naturel, repose sur des opérations tensorielles. Cependant, l’explosion des données a poussé les plateformes informatiques numériques classiques, comme les GPU, jusqu’à leurs limites en termes de vitesse, d’évolutivité et de consommation d’énergie.
Comment la lumière permet des calculs tensoriels instantanés
Motivée par ce problème pressant, une collaboration de recherche internationale dirigée par le Dr Yufeng Zhang du groupe photonique du département d'électronique et de nano-ingénierie de l'université Aalto a mis au point une nouvelle approche permettant d'effectuer des calculs tensoriels complexes en utilisant une seule propagation de la lumière. Le résultat est un calcul tensoriel en une seule fois, réalisé à la vitesse de la lumière elle-même.
La recherche a été publiée dans Photonique naturelle.
« Notre méthode effectue les mêmes types d'opérations que celles gérées par les GPU actuels, comme les convolutions et les couches d'attention, mais elles les effectuent toutes à la vitesse de la lumière », explique le Dr Zhang. « Au lieu de nous fier à des circuits électroniques, nous utilisons les propriétés physiques de la lumière pour effectuer de nombreux calculs simultanément. »
Pour y parvenir, les chercheurs ont codé des données numériques dans l’amplitude et la phase des ondes lumineuses, transformant ainsi les nombres en propriétés physiques du champ optique. Lorsque ces champs lumineux interagissent et se combinent, ils effectuent naturellement des opérations mathématiques telles que des multiplications matricielles et tensorielles, qui constituent le cœur des algorithmes d’apprentissage profond.
En introduisant plusieurs longueurs d’onde de lumière, l’équipe a étendu cette approche pour gérer des opérations tensorielles d’ordre encore plus élevé.
Impact potentiel et applications futures
« Imaginez que vous êtes un douanier qui doit inspecter chaque colis à l'aide de plusieurs machines dotées de différentes fonctions, puis les trier dans les bonnes poubelles », explique Zhang.
« Normalement, vous traitez chaque colis un par un. Notre méthode de calcul optique fusionne tous les colis et toutes les machines ensemble : nous créons plusieurs « crochets optiques » qui connectent chaque entrée à sa sortie correcte. Avec une seule opération, un seul passage de lumière, toutes les inspections et tous les tris se font instantanément et en parallèle. «
Un autre avantage clé de cette méthode est sa simplicité. Les opérations optiques se produisent passivement au fur et à mesure que la lumière se propage, donc aucun contrôle actif ou commutation électronique n'est nécessaire pendant le calcul.
« Cette approche peut être mise en œuvre sur presque toutes les plates-formes optiques », explique le professeur Zhipei Sun, responsable du groupe photonique de l'université Aalto. « À l'avenir, nous prévoyons d'intégrer ce cadre informatique directement sur des puces photoniques, permettant aux processeurs basés sur la lumière d'effectuer des tâches d'IA complexes avec une consommation d'énergie extrêmement faible. »
À terme, l'objectif est de déployer la méthode sur le matériel existant ou sur les plates-formes établies par les grandes entreprises, explique Zhang, qui estime prudemment que l'approche sera intégrée à ces plates-formes d'ici trois à cinq ans.
« Cela créera une nouvelle génération de systèmes informatiques optiques, accélérant considérablement les tâches complexes d'IA dans une myriade de domaines », conclut-il.
