Les optiques co-packagées améliorent l'informatique IA avec une connectivité à haut débit
Les fibres optiques transportent la voix et les données à grande vitesse sur de longues distances, et les scientifiques d'IBM Research apportent cette vitesse et cette capacité là où ils ne sont pas allés auparavant : à l'intérieur des centres de données et sur les circuits imprimés, où ils contribueront à accélérer l'informatique générative de l'IA.
Les scientifiques d'IBM Research ont annoncé une nouvelle série d'avancées dans l'assemblage et le conditionnement des puces, appelées optiques co-packagées, qui promettent d'améliorer l'efficacité énergétique et d'augmenter la bande passante en intégrant des connexions de liaison optique à l'intérieur des appareils et dans les murs des centres de données utilisés pour former et déployer de grands modèles de langage. L'ouvrage est publié sur le arXiv serveur de préimpression.
Ce nouveau procédé promet de multiplier par six le nombre de fibres optiques pouvant être connectées au bord d’une puce, une mesure connue sous le nom de densité en bord de mer. Alors que l'intelligence artificielle exige toujours plus de bande passante, cette innovation utilisera le premier guide d'onde optique polymère au monde pour apporter la vitesse et la bande passante de l'optique jusqu'au bord des puces.
Les premiers résultats suggèrent que le passage des interconnexions électriques conventionnelles aux optiques co-packagées réduira les coûts énergétiques pour la formation des modèles d'IA, accélérera la formation des modèles et augmentera considérablement l'efficacité énergétique des centres de données.
Les technologies avancées actuelles de puces et de conditionnement de puces utilisent généralement des signaux électriques pour les transistors de la microélectronique qui alimentent les téléphones, les ordinateurs et presque tout ce que nous faisons. Les transistors, pour leur part, sont devenus plusieurs fois plus petits au fil des décennies, permettant de regrouper davantage de capacités dans un espace donné. Mais même les composants semi-conducteurs les plus performants sont aussi rapides que les connexions entre eux.
Ces connexions nous permettent d'utiliser de manière transparente les appareils électroniques dans notre vie quotidienne, comme lorsque nous conduisons nos voitures, qui incluent des puces dans presque tous les systèmes, des sièges aux pneus. « Même votre réfrigérateur contient des composants électroniques pour que tout fonctionne correctement », explique John Knickerbocker, ingénieur de recherche chez IBM, ingénieur distingué en chipsets et en emballages avancés.
Knickerbocker et son équipe voient cependant plus petit. En raison de leur coût inférieur et de leur efficacité énergétique supérieure, les connecteurs optiques constituent d'excellents candidats pour améliorer les performances de la communication de puce à puce et de périphérique à périphérique dans les centres de données, où l'informatique générative par IA exige une bande passante de plus en plus élevée.
« Les grands modèles de langage ont rendu l'IA très populaire ces jours-ci dans l'industrie technologique », déclare Knickerbocker. « Et la croissance qui en résulte des LLM – et plus largement de l’IA générative – nécessite une croissance exponentielle des connexions à haut débit entre les puces et les centres de données. »
Et même si les câbles optiques peuvent transporter des données vers et depuis les centres de données, ce qui se passe à l’intérieur est une autre histoire. Même les puces les plus avancées d'aujourd'hui communiquent toujours via des fils à base de cuivre qui transportent des signaux électriques. Il faut beaucoup d'énergie pour établir la liaison depuis le bord d'une puce vers un circuit imprimé, puis depuis le circuit imprimé à travers des kilomètres de câble optique, puis de nouveau vers un autre module et vers une autre puce dans un centre de données distant.
Que vous transmettiez des données ou un appel vocal, l'envoi d'un signal de manière transparente sur toutes ces jonctions coûte de l'énergie. Les connexions filaires à faible bande passante au sein des serveurs ralentissent également les accélérateurs GPU, qui restent inactifs pendant qu'ils attendent les données.
Les signaux électriques utilisent des électrons pour fournir de l’énergie et communiquer des signaux d’un appareil à un autre. L’optique, quant à elle, utilisée depuis des décennies dans les technologies de communication, utilise la lumière pour transmettre des données. Les câbles à fibres optiques, très fins et parfois longs de plusieurs milliers de kilomètres, peuvent transmettre des centaines de térabits de données par seconde.
Regroupées et isolées dans des câbles qui passent sous l'océan, les fibres optiques transportent presque tout le trafic commercial et de communication mondial qui circule entre les continents.
Knickerbocker et ses collègues ont découvert que l'apport de la puissance des connexions optiques aux cartes de circuits imprimés et jusqu'aux puces entraîne une réduction de plus de 80 % de la consommation d'énergie par rapport aux connexions électriques : une réduction de 5 picojoules par bit à moins de 1. Sur des milliers de puces et des millions d’opérations, cela signifie des économies considérables.
L'équipe Chiplet and Advanced Packaging d'IBM Research cherche à rationaliser ce système avec des optiques co-packagées, une approche qui promet d'améliorer l'efficacité et la densité de la communication, à la fois au sein et entre les puces. Une partie de l'intégration de connexions optiques sur les cartes de circuits intégrés consiste à intégrer des émetteurs et des photodétecteurs pour envoyer et recevoir des signaux optiques.
Les fibres optiques ont un diamètre d’environ 250 microns, soit environ trois fois la largeur d’un cheveu humain. Cela peut paraître minuscule, mais quatre fibres totalisent un millimètre, et à mesure que les millimètres s'additionnent, vous manquez rapidement d'espace sur les bords d'une puce.
La solution, selon les scientifiques d'IBM Research, réside dans la prochaine génération de liaisons optiques permettant des connexions beaucoup plus denses : le guide d'onde optique polymère. Ce dispositif permet d'aligner des faisceaux de fibres optiques haute densité juste au bord d'une puce de silicium afin qu'elle puisse communiquer directement à travers les fibres polymères. Les connexions optiques haute fidélité nécessitent des tolérances rigoureuses d’un demi-micron ou moins entre une fibre et un connecteur, un exploit que l’équipe a désormais réalisé.
Grâce à ces approches, l'équipe a démontré la viabilité d'un pas de 50 microns pour les canaux optiques, couplé à des guides d'ondes photoniques en silicium et à un connecteur enfichable sur des réseaux de fibres de verre monomodes (SMF), en utilisant des processus de conditionnement d'assemblage standard. Cela représente une réduction de taille de 80 % par rapport au pas conventionnel de 250 microns, mais les tests indiquent qu'ils peuvent le réduire encore davantage, jusqu'à 20 ou 25 microns, ce qui correspondrait à une augmentation de 1 000 à 1 200 % de la bande passante.
La perte d'insertion du circuit intégré photonique (PIC) vers la liaison optique SMF est généralement comprise entre 1,5 et 2 décibels (dB) par canal, mais dans ce cas, il a été démontré qu'elle est inférieure à 1,2 dB par liaison optique complète. De plus, des démonstrations avec des guides d'ondes optiques au pas de 18,4 micromètres ont montré une diaphonie inférieure à 30 dB, ce qui indique que cette technologie optique co-packagée est évolutive jusqu'à une densité de bande passante très élevée pour l'interconnexion des puces.
Cela signifie qu'en tirant une leçon de l'industrie téléphonique, ils peuvent transmettre plusieurs longueurs d'onde de lumière par canal optique, ce qui a le potentiel d'augmenter cette augmentation de bande passante d'au moins 4 000 % et jusqu'à 8 000 %.
Au-delà des connexions fibre à puce et fibre à carte, ils renforcent également les fibres de verre conventionnelles avec des polymères à haute résistance, une démarche qui améliore la durabilité et l'efficacité, mais nécessite également des simulations avancées de modélisation des longueurs optiques pour garantir que la lumière peut transmettre à travers plusieurs composants sans aucune perte – le « co-packaging » de tout cela.
Ce processus de développement comprend également des tests de résistance aux normes de l'industrie pour garantir que toutes les liaisons optiques et électriques fonctionnent toujours lorsqu'elles sont soumises aux contraintes observées lors de la fabrication et de l'utilisation des applications.
Les composants sont soumis à des températures allant de -40°C à 125°C, ainsi qu'à des tests de durabilité mécanique pour confirmer que les fibres optiques peuvent supporter une flexion sans se casser ni subir de perte de données. Ces tests ont lieu au siège mondial d'IBM Research à Yorktown Heights, New York, ainsi qu'à l'usine IBM de Bromont, Québec.
« Le gros problème n'est pas seulement que nous avons obtenu cette grande amélioration de la densité des communications sur le module, mais nous avons également démontré que cela est compatible avec les tests de résistance que les liaisons optiques n'ont pas réussis dans le passé », explique Knickerbocker. .
Les modules d'IBM sont censés être compatibles avec les processus d'assemblage d'emballages avancés passifs électroniques standard, ce qui peut entraîner une baisse des coûts de production. Grâce à cette innovation, IBM peut produire des modules optiques co-packagés à son usine de Bromont.
L'équipe élabore une feuille de route pour les prochaines étapes que cette technologie prendra, notamment en sollicitant les commentaires des clients IBM et en permettant aux optiques co-packagées de répondre aux besoins commerciaux en matière de calcul d'IA générative.
« Nous travaillerons également avec les fournisseurs de composants pour les positionner pour cette prochaine étape technologique », déclare Knickerbocker, « ainsi que pour les positionner pour qu'ils soient capables de prendre en charge des quantités de production, pas seulement des prototypes ».