Le traitement matériel pour l’IA passe à la 3D, augmentant ainsi la puissance de traitement
Dans un article publié dans Photonique naturelledes chercheurs de l’Université d’Oxford, ainsi que des collaborateurs des Universités de Münster, Heidelberg et Exeter, rendent compte de leur développement d’un matériel photonique-électronique intégré capable de traiter des données tridimensionnelles (3D), améliorant considérablement le parallélisme du traitement des données pour l’IA. Tâches.
L’efficacité du traitement des puces informatiques conventionnelles double tous les 18 mois, mais la puissance de traitement requise par les tâches modernes d’IA double actuellement tous les 3,5 mois environ. Cela signifie que de nouveaux paradigmes informatiques sont nécessaires de toute urgence pour faire face à la demande croissante.
Une approche consiste à utiliser la lumière au lieu de l’électronique, ce qui permet d’effectuer plusieurs calculs en parallèle en utilisant différentes longueurs d’onde pour représenter différents ensembles de données. En effet, dans un travail révolutionnaire publié dans la revue Nature en 2021, bon nombre de ces mêmes auteurs ont démontré une forme de puce de traitement photonique intégrée qui pourrait effectuer la multiplication vectorielle matricielle (une tâche cruciale pour les applications d’IA et d’apprentissage automatique) à des vitesses bien supérieures aux approches électroniques les plus rapides. Ces travaux ont abouti à la naissance de la société d’IA photonique Salience Labs, une spin-out de l’Université d’Oxford.
Aujourd’hui, l’équipe est allée plus loin en ajoutant une dimension parallèle supplémentaire à la capacité de traitement de ses puces photoniques multiplicatrices à matrice-vecteur. Ce traitement « de dimension supérieure » est rendu possible par l’exploitation de plusieurs fréquences radio différentes pour coder les données, propulsant le parallélisme à un niveau bien au-delà de celui atteint précédemment.
À titre de test, l’équipe a appliqué son nouveau matériel à la tâche d’évaluation du risque de mort subite due aux électrocardiogrammes de patients atteints de maladies cardiaques. Ils ont réussi à analyser simultanément 100 signaux d’électrocardiogramme, identifiant le risque de mort subite avec une précision de 93,5 %.
Les chercheurs ont en outre estimé que même avec une mise à l’échelle modérée de 6 entrées × 6 sorties, cette approche peut surpasser les processeurs électroniques de pointe, offrant potentiellement une amélioration 100 fois supérieure de l’efficacité énergétique et de la densité de calcul. L’équipe prévoit de nouvelles améliorations du parallélisme informatique à l’avenir, en exploitant davantage de degrés de liberté de la lumière, tels que la polarisation et le multiplexage de modes.
Le premier auteur, le Dr Bowei Dong du Département des matériaux de l’Université d’Oxford, a déclaré : « Nous pensions auparavant que l’utilisation de la lumière au lieu de l’électronique ne pouvait augmenter le parallélisme qu’en utilisant différentes longueurs d’onde ; mais nous avons ensuite réalisé que l’utilisation des radiofréquences pour représenter les données ouvre une autre dimension, permettant un traitement parallèle ultra-rapide pour le matériel d’IA émergent.
Le professeur Harish Bhaskaran, du Département des matériaux de l’Université d’Oxford et co-fondateur de Salience Labs, qui a dirigé les travaux, a déclaré : « C’est une période passionnante pour mener des recherches sur le matériel d’IA à l’échelle fondamentale, et ce travail est un exemple de comment ce que nous pensions être une limite peut être encore dépassé. »