Tout le monde développe des puces qui concurrencent celles de NVIDIA. Ils sont dans la mauvaise course
Qualcomm a annoncé lundi qu'il travaillait sur des puces accélératrices d'IA, ce qui signifie qu'il y aura une nouvelle concurrence pour NVIDIA. L'entreprise qui domine le paysage du matériel d'IA voit un grand groupe de concurrents tenter d'éroder cette position, mais le problème pour toutes ces entreprises n'est pas les puces, mais autre chose. Un appel CUDA.
Que s'est-il passé ? Qualcomm a annoncé la puce AI200, qui commencera à être vendue en 2026, et l'AI250, qui le fera en 2027. Les deux pourront fonctionner dans des systèmes de type rack dotés d'un refroidissement liquide. Les serveurs Qualcomm peuvent avoir jusqu'à 72 puces basées sur les NPU Hexagon des SoC Snapdragon de la société.
Inférence oui, formation non. La société a révélé que ses puces se concentrent sur l'inférence (l'exécution de modèles d'IA) et non sur la formation. Leurs systèmes basés sur rack auront des coûts d'exploitation inférieurs à ceux des fournisseurs de systèmes cloud, affirme Qualcomm. Chaque rack consomme 160 kW, un chiffre comparable à la consommation de certains racks basés sur des GPU NVIDIA. Il n'y a aucun détail sur le prix de ces puces, les cartes ou les racks qui les intégreront, ni sur le nombre de NPU pouvant être proposés dans chaque rack. Ce que nous savons, c'est que les cartes accélératrices de Qualcomm prendront en charge jusqu'à 768 Go de mémoire, soit plus que ce que proposent NVIDIA ou AMD dans leurs modèles actuels selon CNBC.
Chips pour tiers. L'autre point important est que Qualcomm vendra ses puces IA et autres composants séparément, permettant ainsi aux grandes entreprises d'IA de « personnaliser » leurs propres racks basés sur les puces Qualcomm. C'est une philosophie identique à celle qu'ils ont adoptée dans le monde de leurs SoC mobiles. Les investisseurs ont accueilli la nouvelle avec un optimisme exceptionnel et les actions Qualcomm ont augmenté de 11 % lors de la séance de lundi.
NVIDIA domine d'une main de fer. Dans le segment des puces IA, le roi est NVIDIA. L'entreprise est le protagoniste absolu de ce marché et, selon CNBC, elle détient une part de marché de 90 %, ce qui lui a permis de faire monter en flèche sa valorisation à 4,5 milliards de dollars. Cette domination pourrait désormais être menacée par l’avalanche de puces arrivant de différents fabricants.
Tout contre NVIDIA. AMD a son excellent Instinct, Google a son TPU, Amazon son Trainium, Microsoft son Maia et Huawei a son Ascend. Tous font des propositions vraiment marquantes pour les puces NVIDIA, et petit à petit ces solutions sont intégrées dans de plus en plus de centres de données. Mais le vrai problème ne réside pas dans le matériel, mais dans le logiciel.
Le grand défi est de vaincre CUDA. LE standard de facto de l'industrie de l'IA que les développeurs utilisent est CUDA, une plateforme qui permet de profiter pleinement des capacités des puces NVIDIA dans le domaine de l'intelligence artificielle. Cette combinaison matériel+logiciel est bien plus mature que celle de ses concurrents, qui ont résolu la partie matérielle (ou sont sur la bonne voie) mais ne disposent pas de plateforme comparable à CUDA. AMD dispose de ROCm, ce qui est particulièrement intéressant car il est Open Source, mais pour le moment ses fonctionnalités n'atteignent toujours pas celles de CUDA.
Réinventer la roue ? CUDA est sur le marché depuis près de deux décennies, ce qui signifie que la majorité des recherches universitaires et des modèles pionniers, tels qu'ImageNet, ont été écrits pour CUDA. Ce n'est pas un langage, c'est une vaste collection de bibliothèques, de frameworks optimisés (comme cuDNN), d'outils de débogage et une immense communauté. Développer un concurrent, c'est fondamentalement comme réinventer la roue, et les migrations coûtent cher et les entreprises et startups n'auront pas du mal à l'assumer.
La Chine est également dans le combat. Et bien sûr, s’il y a un autre grand protagoniste de cette course, c’est bien la Chine. Le géant asiatique, auparavant dépendant de NVIDIA, cherche à se débarrasser de ce fabricant et, parallèlement au développement de puces d'IA avancées, il essaie également de disposer de son propre logiciel d'IA pour surpasser CUDA.
À Simseo | L’IA est la meilleure chose qui arrive à la fusion nucléaire. La construction d’ITER s’accélère déjà
