Nous savions que la puce B200 AI de NVIDIA serait une bête. Nous sommes loin de sa puissance

Lorsque NVIDIA a dévoilé sa puce B200 pour les applications d'intelligence artificielle (IA) en mars de cette année, il était évident qu'elle avait une véritable bête entre les mains. Ses fonctionnalités sont celles qui éliminent le problème : 208 milliards de transistorsarchitecture Blackwell de dernière génération, performances maximales de 20 petaFLOPS dans les opérations FP4 si elles sont accompagnées d'un refroidissement liquide, peuvent fonctionner de pair avec une carte mémoire allant jusqu'à 192 Go de VRAM et atteindre une bande passante de 8 To/s.

Il est évident qu'avec ces spécifications, le Département américain du Commerce dirigé par Gina Raimondo ne permettra pas à NVIDIA de vendre ce GPU en Chine. En tout cas, c'est une autre histoire. La société de Jensen Huang commencera probablement la production à grande échelle de la puce B200 au cours du quatrième trimestre 2024, les premières livraisons de ce GPU auront donc lieu avant la fin de cette année. Cependant, la production de cette puce n’a pas du tout été du gâteau pour NVIDIA.

La fabrication a été compliquée, mais au final les performances sont à la hauteur (selon NVIDIA)

Les premières unités de la puce B200 ont mis du temps à arriver. NVIDIA a avoué que les performances de ses processus de fabrication étaient inférieures aux attentes, ce qui a obligé ses ingénieurs à repenser certaines couches de la puce afin de corriger un problème qui pourrait retarder la livraison des premières unités. « Nous avons été obligés d'introduire une modification dans le skin du GPU Blackwell pour améliorer les performances de production », a admis NVIDIA dans un communiqué.

« Nous avons été obligés d'introduire une modification dans le skin du GPU Blackwell pour améliorer les performances de production »

Quoi qu'il en soit, il semble que les changements introduits par les techniciens de l'entreprise dans le masque aient fonctionné. Comme nous l'avons vu quelques lignes plus haut, la fabrication à grande échelle de cette puce débutera au cours du quatrième trimestre de cette année. Et pour vous mettre en appétit, NVIDIA a publié sur son blog les premiers indices de performances de la puce B200. Nous savions qu'il allait être très puissant, et oui, ces premiers chiffres montrent que lorsqu'il arrivera, ce sera sans aucun doute le GPU AI le plus performant du marché. Il est évident qu'il est plus prudent pour nous d'accepter les chiffres de NVIDIA avec un certain scepticisme, mais ils servent à nous donner une idée approximative de la capacité de cette puce.

Selon les premiers résultats de MLPerf 4.1, la puce B200 multiplie par quatre les performances de son prédécesseur, le GPU H100 implémenté sur la microarchitecture Hopper. Si tel est le cas, cette différence de performances est scandaleuse. De plus, la puce B200, toujours selon NVIDIA, délivre 10 755 jetons par seconde lors d'un test d'inférence et 11 264 jetons par seconde lors d'un test de référence. Vous pouvez consulter tous les résultats dans l'article publié par NVIDIA. Il est clair que le GPU B200 sera la puce IA à battre, mais nous pouvons être sûrs qu'AMD, Huawei et d'autres sociétés répondront bientôt. Nous serons attentifs.

Images | Nvidia

Plus d'informations | Nvidia

À Simseo | Huawei veut dévorer NVIDIA sur le marché chinois. Pour y parvenir, il travaille sur un nouveau GPU pour l'IA