veut avoir le matériel dominant dans les processus d'inférence d'IA

Les sanctions américaines contre la Chine ont placé NVIDIA dans une position très vulnérable. La société dirigée par Jensen Huang ne peut pas livrer ses GPU d’intelligence artificielle (IA) les plus avancés à ses clients chinois, et pourtant, continue de dominer le marché chinois. Et cela en grande partie grâce à l’énorme succès commercial de la puce H20, qui n’est rien de plus qu’une révision allégée de ses GPU les plus puissants qu’elle peut vendre en Chine.

Le gouvernement dirigé par Xi Jinping souhaite que les entreprises technologiques chinoises cessent d’acheter des circuits intégrés à NVIDIA. La démarche qu’il a entreprise début octobre dernier était purement informative, mais, en tout cas, il s’est adressé expressément aux entreprises qui achètent des GPU pour l’IA dans le but de leur recommander d’acheter des puces produites en Chine, et non les solutions de Jensen Huang. entreprise.

Huawei pense avoir trouvé une veine

NVIDIA perd en compétitivité en Chine. C’est inévitable. Le GPU H20, sur le papier, est bien moins performant que les puces IA les plus sophistiquées actuellement vendues par la société de Jensen Huang. Pour le moment, le ministère chinois de l’Industrie et des Technologies de l’information n’a rien rendu officiel, mais l’administration dirigée par Xi Jinping a restreint l’achat de GPU NVIDIA H20 par les entreprises chinoises depuis août dernier.

D’un autre côté, Huawei dispose de ses propres GPU AI, les puces Ascend AI, depuis plus de cinq ans. Durant cette période, elle les a perfectionnés et augmenté ses capacités dans le but d’égaler, voire même surperformer des puces A100 et H100 de NVIDIA. Selon certains analystes, comme ceux de la société chinoise iFly Tek, la puissance brute de leurs GPU est égale à celle des puces NVIDIA, mais ils ont encore un temps de retard si l’on s’en tient à leurs performances dans un scénario d’utilisation réel.

La plupart des projets d’IA développés en Chine et à l’étranger sont mis en œuvre sur le CUDA de NVIDIA.

Pour Huawei, la situation actuelle représente une opportunité imbattable pour renforcer sa présence dans son propre pays. Cependant, cette société et d’autres sociétés chinoises sont confrontées à un grand défi qui ne leur permettra pas de conquérir facilement le marché que NVIDIA domine jusqu’à présent : la plupart des projets d’IA développés en Chine et à l’étranger sont mis en œuvre sur en haut de CUDA (). Cette technologie regroupe le compilateur et les outils de développement utilisés par les programmeurs pour développer leurs logiciels pour les GPU NVIDIA.

Huawei possède CANN (), qui est son alternative à CUDA, mais il existe un consensus parmi les analystes sur le fait que cette plate-forme est encore très loin des capacités dont dispose la technologie NVIDIA en train de formation de modèles d’IA. C’est cette situation qui a amené, selon le Financial Times, Huawei à avoir décidé de mettre tous ses efforts pour que son matériel maîtrise non pas l’entraînement de modèles d’IA, mais plutôt l’inférence.

« La formation est importante, mais elle n’arrive que quelques fois. Huawei se concentre principalement sur l’inférence, ce qui nous permettra à terme d’accéder à davantage de clients », explique Georgios Zacharopoulos, chercheur principal en IA travaillant sur l’accélération de l’inférence au laboratoire Huawei de Zurich ( Suisse). L’inférence est au sens large le processus informatique effectué par les modèles de langage dans le but de générer des réponses qui correspondent aux requêtes qu’ils reçoivent.

Images | Huawei

Plus d’informations | Temps Financier

À Simseo | Le pouls de NVIDIA et de l’administration américaine devient plus virulent. Les GPU B20 pour l’IA sont en danger