NVIDIA a perdu espoir en Chine, c'est pourquoi elle a commencé à fabriquer ses propres GPU de nouvelle génération pour l'IA

NVIDIA fait face à une année cruciale en 2026. Ils sont devenus l'un des plus grands investisseurs stratégiques dans l'écosystème de l'IA avec des dizaines d'investissements d'un milliard de dollars dans d'autres entreprises, modèles, infrastructures et robotique. Mais en fin de compte, c’est une entreprise qui fournit des puces et, jusqu’à présent, les H200 ont établi la norme. Selon un rapport du Financial Times, c'est fini. NVIDIA vient de commander à TSMC de commencer la fabrication en série de Vera Rubin, son matériel de nouvelle génération pour l'IA.

La raison ? Ils ont perdu toute confiance en la Chine.

En bref. Alors que l'ensemble du secteur de l'IA est tourné vers l'avenir et que NVIDIA a sa Vera Rubin sur la grille de départ, il était étrange que l'entreprise continue à investir autant pour que TSMC continue de travailler sur une puce aussi ancienne que le H200. Bien qu'elle existe depuis un certain temps, elle s'est positionnée comme imbattable dans l'industrie en raison de son rapport prix/puissance, ce sont donc les puces sur lesquelles l'empire de l'IA a été construit.

Cependant, le temps passe et NVIDIA doit bouger. Les centres de données ont besoin de plus de puissance, les nouveaux modèles sont plus exigeants et les fers de lance du secteur du logiciel – comme OpenAI ou Google – ont exigé de nouvelles solutions. Selon deux sources consultées par les médias financiers, et proches des projets de NVIDIA, la société en a assez de « attendre dans le flou » et a commencé à accélérer la livraison et le déploiement de Vera Rubin.

Incomparable. Comme il ne pouvait en être autrement, c’est TSMC qui sera aux commandes. Il aurait déjà été demandé à la fonderie taïwanaise de commencer à diversifier la chaîne de production pour commencer à fabriquer les nouvelles puces. Et si vous vous demandez pourquoi il ne suffit pas que Google ou OpenAI achètent simplement plus de H200, la réponse est que les puces n'ont rien à voir avec cela.

Le H200 est un GPU plus classique pour un data center. C’est la configuration avec laquelle les sociétés d’IA et d’informatique travaillent sur ces serveurs depuis des années. Vera Rubin, cependant, représente un changement de paradigme composé de nouveaux processeurs, de nouveaux GPU et conçu pour que tout fonctionne comme un seul accélérateur à l'échelle du rack. Il dispose non seulement de plus de puissance, mais également des derniers ajouts logiciels et matériels de NVIDIA et de quelque chose de très important : une bande passante incroyable.

Plus la bande passante d’un tel système est élevée, plus il peut gérer de données simultanées. Cela implique une plus grande efficacité lors de la formation, mais également un coût moindre en inférence. Il ne s’agit pas d’une mise à jour, c’est d’un changement de plateforme conçu pour des modèles comportant des milliards de paramètres.

Apple a toujours été le « client A » de la plus grande fonderie technologique au monde. NVIDIA vient de supprimer son poste

Peu de confiance en la Chine. Pour faire plus simple, si le H200 s'apparente à une « carte graphique super puissante », Vera Rubin s'apparente à un mini data center à elle seule. Et si vous vous demandez pourquoi ils n’ont pas démarré la production plus tôt, la raison est… la Chine. Jensen Huang, PDG de NVIDIA, se « bat » depuis des mois avec Washington pour ouvrir les bras dans la guerre commerciale et technologique entre les États-Unis et la Chine. Trump a fini par accepter et Huang a déclaré au début de cette année qu’ils avaient « allumé » toutes les lignes de production pour répondre à la très forte demande chinoise.

Le problème est que cette demande n’est pas arrivée. Au moins, ce n’était pas aussi élevé que ce à quoi Huang s’attendait. Lors de la présentation des résultats, le directeur financier de NVIDIA a déclaré il y a quelques jours que « bien que de petites quantités de H200 destinées aux clients chinois aient été approuvées par le gouvernement américain, nous n'avons pas encore généré de revenus. Et nous ne savons pas si les importations en Chine seront autorisées ». Nous avons déjà expliqué le problème : les États-Unis laissaient NVIDIA vendre ses graphiques, mais le gouvernement chinois ne semblait pas aussi convaincu.

Leurs grandes sociétés technologiques réclamaient les solutions de NVIDIA, arguant qu'elles en avaient besoin pour suivre ce que font leurs rivaux américains, mais la balle était dans le camp du gouvernement et des douanes. La Chine promeut une IA différente de celle des États-Unis, davantage axée sur les faibles coûts et l’acceptation rapide par les clients, et souhaite en même temps construire son propre réseau matériel avec des entreprises comme SMIC ou Huawei qui disposent déjà de leur supercalculateur pour l’IA.

Un écart compliqué. Le Financial Times souligne que le président chinois, Xi Jinping, et le président des États-Unis se rencontreront fin mars pour discuter du contrôle des exportations. Le problème est que, selon leurs sources, même si la barrière est levée complètement et pas seulement pour certaines entreprises et que la Chine peut acheter des H200 en masse, faire demi-tour au navire de TSMC pour qu'il recommence à produire des H200 serait compliqué.

Ce n’est pas aussi simple que d’appuyer sur un bouton et de passer d’une chose à une autre. Si cette situation se produisait, « NVIDIA prendrait jusqu’à trois mois pour réaffecter ou ajouter de la capacité à la chaîne d’approvisionnement afin de produire du H200 ».

Un des PCB de Vera Rubin

Gagnant du rebond. Ce qui est clair ici, c'est que NVIDIA ne va pas perdre dans cette opération. Huang affirmait déjà que les États-Unis ne pouvaient pas laisser passer l'occasion de profiter d'un marché valant des milliards (car ils autorisaient la vente des cartes… avec un tarif de 25 %), mais qu'il s'agisse de l'industrie chinoise ou occidentale, c'est à NVIDIA qu'ils continuent d'acheter les H200 et, « prochainement », les Vera Rubin.

Et le gagnant du rebond dans cette opération est Samsung. Parmi les trois entreprises qui fabriquent de la mémoire (et qui ont catapulté la crise de la RAM et du SSD dans laquelle nous nous trouvons), Samsung est celle qui a achevé sa mémoire HBM4 de nouvelle génération. C'est celui qui a satisfait aux normes élevées de NVIDIA et celui qui est déjà fabriqué en série pour pouvoir s'intégrer aux systèmes Vera Rubin.

NVIDIA est l’entreprise la plus valorisée au monde car elle n’a pas de concurrence. Jusqu'à ce que Google commence à fabriquer des puces

Tout le monde attentif. Comme nous l'avons dit, NVIDIA a l'ensemble du secteur à ses pieds. Google, xAI et Meta travaillent sur leurs propres puces, mais aux côtés de Microsoft, Amazon Web Services, OpenAI, Mistral et Anthropic font partie des entreprises qui souhaitent les nouvelles puces NVIDIA. Des fabricants tels que Dell, Lenovo, Oracle et IBM ont également annoncé des systèmes basés sur Vera Rubin pour les centres de données d'entreprise au CES de cette année.

NVIDIA aurait envoyé des échantillons de Vera Rubin à certains partenaires il y a quelques jours à peine, et le déploiement complet devrait avoir lieu entre la fin de l'année et 2027. Donc, si vous attendiez que la RAM (et tout produit technologique) baisse de prix à court terme, vous pouvez attendre : le monde a besoin de plus de publicités Coca-Cola alimentées par l'IA ou de la possibilité de créer des images Ghibli.

Images | NVIDIA, Karola G, Pexels

À Simseo | Que Qualcomm prépare ses propres puces IA est une bonne nouvelle. Qu'il ait une opportunité sur le marché est une chose très différente.