des « usines à jetons » avec leur propre matériel

des « usines à jetons » avec leur propre matériel

La course à l’IA ne s’explique plus simplement en regardant quelle entreprise lance le modèle le plus puissant ou qui a accès aux puces les plus avancées. Cette partie est toujours importante, mais elle ne raconte pas toute l’histoire. Ce qui commence à émerger est une dynamique beaucoup plus large visant à garantir les ressources nécessaires pour continuer à être compétitif. La Chine défend cette idée avec une formule qu’elle appelle « usines symboliques ».

En action. L’exemple le plus récent vient de Wuxi, une ville de la province du Jiangsu, dans l’est de la Chine. Selon le Global Times, Honflex et la zone de haute technologie de Wuxi y ont promu le premier supernode informatique Huawei Ascend 384 de la province. L’idée est d’utiliser cette infrastructure comme point de départ pour une installation à grande échelle visant à offrir au marché une capacité d’IA mesurée en jetons.

La demande augmente. Si de plus en plus d’applications utilisent des modèles de langage et des agents d’IA, quelqu’un doit fournir de manière stable la capacité de les exécuter. Xinhua souligne qu’à fin mars 2026, les demandes quotidiennes de tokens en Chine dépassaient les 140 000 milliards, soit plus de 1 000 fois plus qu’au début 2024 et 40 % de plus qu’à fin 2025. C’est là que le concept d’« usine » prend un peu plus de sens.

Signification de l’étiquette. Dans la pratique, les centres de données IA fonctionnent déjà comme des usines à jetons. Ils exécutent des modèles, reçoivent des requêtes et renvoient des réponses. Ce qui change ici, ce n’est pas tant la nature technique que la manière de le transformer en produit industriel. Il présente la puissance de calcul comme quelque chose de mesurable et vendable pour les entreprises qui ont besoin de l’IA sans construire elles-mêmes l’intégralité de l’infrastructure.

En détails. L’installation de Wuxi démarrera avec quatre serveurs Huawei Ascend 384. La promesse ici est de créer un cluster haute performance basé sur des puces et des modèles nationaux. En parallèle, China Mobile a annoncé le 17 mai avoir construit un centre de calcul au Hubei pour le centre du pays, doté d’une infrastructure d’IA développée localement et d’une capacité de calcul intelligente supérieure à 2 200 pétaflops.

Une lecture de la souveraineté technologique. Dans les deux projets, l’accent est mis sur les infrastructures chinoises, les puces chinoises et les modèles nationaux. Il n’y a aucune mention de la technologie américaine comme base du déploiement, ni des puces NVIDIA, bien que l’entreprise américaine continue d’être une référence mondiale en matière de matériel d’IA et ait joué un rôle très important en Chine. Ce cadrage s’inscrit dans les efforts du géant asiatique pour gagner en autonomie dans une technologie stratégique. Les initiatives semblent également aller dans ce sens.

La course continue. Si l’on prend le lancement de ChatGPT en novembre 2022 comme point de départ de cette nouvelle course à l’IA, peu de temps s’est écoulé sur le calendrier, mais beaucoup de choses se sont écoulées dans l’industrie. Les États-Unis ne sont plus exactement le même acteur qu’à l’époque, la Chine non plus, et entre-temps, nous avons assisté à des restrictions à l’exportation, à des va-et-vient réglementaires, au développement d’alternatives nationales et à une pression croissante pour sécuriser la base technologique qui nous permet de continuer à être compétitifs. Dans ce contexte, la notion d’« usines à jetons » apparaît. Il reste maintenant à attendre pour voir si cela se traduira par un réel avantage.

Images | Simseo avec Nano Banane

À Simseo | Si la question est de savoir si les centres de données IA finissent par augmenter les températures dans une région, la réponse est : 2,2°C