Intel Gaudi 3 est une carte accélératrice d'IA. Celui qui sur le papier surpasse le NVIDIA H100 en puissance et en efficacité
Jusqu'à présent NVIDIA était imbattable dans le monde des puces IA pour grandes entreprises et centres de données, mais Intel vient d'annoncer un produit qui pourrait changer la donne : le Accélérateur IA Gaudi 3.
Selon Intel, cette puce est capable d'offrir une capacité d'inférence 50 % supérieure et une efficacité énergétique moyenne 40 % supérieure à celle du produit de référence dans ce secteur, les puces H100 de NVIDIA.
En fait, Intel se vante que son Gaudi 3 coûte « une fraction » du coût des graphiques spécialisés H100, bien qu'il ne détaille pas exactement la différence. On sait cependant que les H100 de NVIDIA coûtent facilement autour de 30 000 $.
Cette carte accélératrice d'IA, soulignent ses responsables, sera utilisée dans de grands systèmes comportant des dizaines de milliers d'unités interconnectées via des connexions Ethernet. Gaudi 3 est quatre fois plus puissant dans les tâches d'IA et dispose de 1,5 fois plus de bande passante mémoire que son prédécesseur.
La première version de Gaudi a été réalisée avec une photolithographie 16 nm. Gaudi 2 a utilisé des procédés en 7 nm, mais dans cette troisième génération, il est allé plus loin et utilise la photolithographie en 5 nm, ce qui permet l'intégration d'un plus grand nombre de transistors et des gains en puissance et en efficacité.
Sa capacité est certainement prometteuse, et Intel affirme que Gaudi 3 sera en mesure d'offrir des temps d'entraînement 50 % meilleurs en utilisant les modèles Llama 2 7B et 13B, en plus du GPT-3 avec des paramètres 175B.
Nous sommes avant un marché en pleine effervescence: AMD a déjà présenté ses propres cartes accélératrices en décembre, les Instinct MI300X, qui s'ajoutaient aux APU Instinct MI300A et offraient également une alternative au H100 de NVIDIA à une fraction du prix.
Bien sûr, chez NVIDIA, ils ne restent pas exactement immobiles et il y a quelques jours nous avons entendu parler de leur nouvelle puce B200 avec architecture Blackwell. Ce monstre de 208 milliards de transistors (le H100 en compte 80 milliards) sera disponible en 2024, et va sans doute remodeler la concurrence dans ce secteur.
Gaudi devrait être disponible pour les OEM tels que HP Enterprise (HPE), Lenovo et Supermicro au deuxième trimestre 2024. Aucun prix n'a été précisé pour ces cartes accélératrices.
À Simseo | Le lancement de la nouvelle superpuce IA de NVIDIA laisse une question : où sont ses équivalents PC et mobiles ?