Le patron de NVIDIA n'ignore pas le problème quand les choses ne vont pas

Le patron de NVIDIA n'ignore pas le problème quand les choses ne vont pas

Lorsque NVIDIA a dévoilé sa puce B200 pour les applications d'intelligence artificielle (IA) en mars de cette année, il était évident qu'elle avait une véritable bête entre les mains. Ses caractéristiques sont époustouflantes : 208 milliards de transistors, Architecture « Blackwell » dernière génération, 20 pétaFLOPS de performances maximales dans les opérations FP4 si elles sont accompagnées d'un refroidissement liquide, peuvent fonctionner de pair avec une carte mémoire allant jusqu'à 192 Go de VRAM et atteindre une bande passante de 8 To/s.

Curieusement, les premières unités de la puce B200 ont mis du temps à arriver. NVIDIA a avoué que les performances de ses processus de fabrication étaient inférieures aux attentes, ce qui a obligé ses ingénieurs à repenser certaines couches de la puce afin de corriger un problème qui a retardé la livraison des premières unités. « Nous avons été obligés d'introduire une modification dans le skin du GPU Blackwell pour améliorer les performances de production », a admis NVIDIA dans un communiqué.

Jensen Huang a montré son visage

Les changements apportés par les techniciens de cette entreprise au masque ont fonctionné. La fabrication à grande échelle de cette puce est déjà en cours et NVIDIA a vraisemblablement réussi à corriger les problèmes qui entravaient les performances de ses processus de fabrication. Pour vous mettre en appétit, il a publié sur son blog les premiers indices de performances de la puce B200. Nous savions qu'il allait être très puissant, et oui, ces premiers chiffres reflètent que lorsqu'il arrivera, ce sera sans aucun doute le GPU AI le plus performant du marché, même s'il est plus prudent pour nous d'accepter les chiffres de NVIDIA avec un certain scepticisme.

Jensen Huang a déclaré que NVIDIA était responsable du problème et que grâce à la collaboration de TSMC ils ont réussi à le résoudre

Ce qui est curieux, c'est que les problèmes survenus lors de la fabrication des puces B200 ont amené certains médias à suggérer que TSMC était responsable et que ses relations avec NVIDIA s'étaient détériorées pour cette raison. Rien ne pourrait être plus éloigné de la vérité. Jensen Huang a déclaré que NVIDIA est responsable du problème et que grâce à la collaboration de TSMC, ils ont réussi à le résoudre et sont prêts à démarrer la production à grande échelle de cette puce avancée pour l'intelligence artificielle.

« C'était à 100% la faute de NVIDIA. Nous avions un défaut de conception chez Blackwell. C'était une puce fonctionnelle, mais le défaut provoquait de mauvaises performances (…) Les rapports décrivant des tensions entre NVIDIA et TSMC sont faux », a-t-il déclaré. Il est évident que le patron de NVIDIA assume l'entière responsabilité du problème du GPU B200 et veut à tout prix empêcher TSMC de se sortir de ce revers. Comme nous venons de le voir, la production de cette puce n'a pas du tout été du gâteau pour NVIDIA, mais cette société espère livrer les premières unités de ce GPU avant la fin de cette année.

Images | Nvidia

Plus d'informations | Reuters

À Simseo | Huawei veut dévorer NVIDIA sur le marché chinois. Pour y parvenir, il travaille sur un nouveau GPU pour l'IA