La Big Tech a confié les clés de son royaume à NVIDIA. Maintenant, ils veulent récupérer les clés
NVIDIA n’est plus un fabricant de cartes graphiques de jeu : NVIDIA est une entreprise omniprésente. Cela signifie que c’est le bébé au baptême, la mariée au mariage et le ciment de l’industrie de l’intelligence artificielle. Votre matériel se trouve dans les centres de données les plus puissants de la planète, vos logiciels contrôlent tout et votre argent est investi dans toute entreprise qui a son mot à dire en matière d’IA. Big Tech (et tout le monde) fait aveuglément confiance à NVIDIA et a reçu les clés de la maison, mais quelque chose est en train de changer.
Et maintenant, ils veulent récupérer les clés pour reprendre le contrôle.
Tous les projecteurs. Microsoft, Amazon, Google et Meta ont acheté des centaines de milliers de GPU NVIDIA pour façonner leurs aspirations en matière d’IA. À un moment donné, beaucoup ont commencé à développer leur propre matériel, mais à la fin, celui de NVIDIA était partout et était celui qui offrait le plus de garanties, alors ils ont « abandonné ». Apple, curieusement, a opté pour Amazon.
Et pas seulement les plus grands. OpenAI, Anthropic, Mistral ou xAI sont des sociétés purement IA qui misent très fortement sur NVIDIA depuis le début. Son matériel est celui qui ouvre la voie, celui que veulent les entreprises occidentales et chinoises et celui qui a une demande si brutale qu’il a élevé l’entreprise au rang de meilleur client de TSMC et Samsung.
DMLA. Mais personne n’aime mettre tous ses œufs dans le même panier, et ces mêmes noms bougent. D’une position de domination absolue, nous pourrons passer en peu de temps à une autre dans laquelle le marché du matériel est beaucoup plus diversifié. AMD est le grand rival historique de NVIDIA sur le segment des jeux sur PC (et sur consoles), mais bien qu’ils aient été absents de la conversation pendant quelques années, ils sont revenus en force.
Ils disposent du matériel et s’efforcent d’obtenir la même mémoire que NVIDIA (et Samsung gagne plus que quiconque) et des contrats aussi juteux que celui qu’ils ont récemment conclu avec Meta. Le grand rival a également les poches profondes et s’engage à prendre une part du gâteau de l’IA.

La menace chinoise. De l’autre côté du monde, nous avons la Chine. Nous avons dit à de nombreuses reprises que la Chine avait d’autres intentions lorsque nous parlons d’IA. Si l’Occident s’en prend à l’AGI (avec des affirmations douteuses comme si elle était déjà là), la Chine s’en fiche. Ils veulent des puces rapides qui leur permettent de créer des modèles accessibles et monétisables à court terme.
Mais ils ont aussi Huawei, l’entreprise qui est devenue le fer de lance de l’industrie technologique chinoise grâce au fait que sa collaboration avec des fonderies comme SMIC leur permet, de manière impensable en raison des vetos, de développer des puces avancées. Le développement de puces de pointe reste à réaliser, mais Huawei dispose déjà de puces d’inférence plus puissantes que le H20 de NVIDIA, selon eux, et d’un supercluster pour la formation.
Reprendre le contrôle. Parce que dans ce terme, « inférence » est la clé actuelle. La formation en IA est importante car c’est ce qui permet au modèle de disposer des données et d’avoir une garde-robe à partir de laquelle puiser, mais l’inférence est la couche finale, qui traite la demande de l’utilisateur de fournir une réponse. Il n’y a pas tellement besoin d’énergie brute, et c’est ce dont profitent presque toutes les entreprises mentionnées ci-dessus.
Amazon, Google ou Meta ont des programmes dans lesquels ils recherchent ou développent activement leurs propres puces d’inférence. OpenAI a signé un accord avec Broadcom pour fournir des puces et xAI, ainsi que d’autres sociétés Musk, disposent également de leurs propres puces et prévoient d’ouvrir des usines. Et en Chine, les choses ne sont pas différentes, Cambricon voulant être une alternative locale à NVIDIA et des géants comme Alibaba ou ByteDance se lançant dans la conception de puces.

Groq. Compte tenu de cela, pensez-vous que NVIDIA reste immobile ? Parmi leurs propositions matérielles, ils ont Groq, un accélérateur d’inférence conçu, avec Vera Rubin, pour traiter une grande quantité de données à une vitesse énorme. Groq était inconnu dans le monde de l’IA – jusqu’à ce que NVIDIA lui accorde une licence – et s’est spécialisé dès le début dans ce domaine : des puces avec une latence minimale pour l’inférence.
La clé est dans l’architecture de ses puces et c’était une pièce qui manquait dans le catalogue NVIDIA et montre que, même si les autres veulent récupérer les clés, celui qui les possédait déjà a peut-être fait une copie de sauvegarde pour continuer à être la référence. Parce qu’ils préparent peut-être tous leurs puces, mais au moment où elles arrivent, NVIDIA est déjà là et, en fait, avec Groq, elle cherche à se faufiler dans le gâteau des 50 milliards de dollars : la Chine.


Problème pour NVIDIA. Mais bien sûr, cela fait partie de l’histoire. L’autre est que NVIDIA met également tous ses œufs dans le même panier : celui de l’IA. Au milieu de l’année dernière, nous avions déjà mentionné que six clients représentaient 85 % de tous les revenus de NVIDIA au trimestre précédent. C’est une absurdité absolue qui montre que, s’il y a un changement de technologie, un éclatement de bulle ou un nouvel acteur qui arrive en force, la situation pour NVIDIA pourrait ne pas être aussi favorable.
La question est de savoir si un changement de régime peut survenir et si tout pourra s’effondrer comme un château de cartes. Ce qui est inconfortable, c’est qu’une somme d’argent absurde est investie et que ce n’est pas quelque chose qui peut être étendu indéfiniment.
À Simseo | Jensen Huang pense que nous avons atteint « l’arrivée du loup IA ». C’est parfait pour nourrir un Tamagotchi
