Huawei est en concurrence avec Nvidia pour la part de marché des puces IA en Chine

HHuawei tente de conquérir une plus grande part du marché chinois des puces IAdominé par Nvidia, encourageant les entreprises locales à adopter ses processeurs concurrents pour «inférence». Les principales sociétés d’IA en Chine s’appuient sur des unités de traitement graphique (GPU) fabriquées par Nvidia pour « entraîner » de grands modèles de langage, et les produits du fabricant de puces américain, estimé à 3,4 milliards de dollars, sont considérés comme essentiels au développement de la technologie. Au lieu de défier Nvidia en formation, Huawei positionne ses derniers processeurs Ascension de l’IA comme matériel de choix pour les groupes chinois exécutant l’inférence, le calcul entrepris par les LLM pour générer une réponse à une invite.

La demande de puces d’inférence devrait augmenter

Le géant chinois de la technologie parie que l’inférence deviendra une source de demande plus importante à l’avenir si le rythme de formation des modèles ralentit et si les applications d’IA telles que les chatbots se généralisent. « La formation est importante, mais elle n’arrive que quelques fois », dit-il. Georgios Zakharopouloschercheur principal en IA travaillant sur l’accélération de l’inférence au laboratoire de Huawei à Zurich. « Huawei se concentre principalement sur l’inférence, qui servira à terme davantage de clients. »

Huawei se concentre sur la voie la moins exigeante techniquement, mais potentiellement rentable, consistant à réutiliser les modèles d’IA formés sur les produits Nvidia pour les faire fonctionner sur les puces Ascend. Étant donné que les GPU Nvidia et Ascend fonctionnent avec des logiciels différents, Huawei aide les entreprises à utiliser un autre outil logiciel pour rendre les deux systèmes compatibles.

Les efforts de Huawei s’accompagnent d’un soutien gouvernemental descendant. Les autorités chinoises ont exhorté les géants technologiques locaux à acheter davantage de puces IA de Huawei et à abandonner Nvidia. Selon certaines informations, Huawei est considéré en interne comme le concurrent le plus sérieux du pays, ajoutant que sa capacité de conception de puces est « avancée ».

Les États-Unis tentent de freiner le développement de l’IA en Chine

Washington a cherché à freiner le développement de l’IA par Pékin en contrôlant les exportations visant à entraver le développement de technologies sensibles en Chine. Contrairement à leurs concurrents américains, comme OpenAI et Google, les sociétés n’ont pas accès aux GPU les plus avancés en Chine. Mais même si les groupes chinois ne peuvent qu’acheter les puces H20 De Nvidia, moins puissants et adaptés aux contrôles à l’exportation, les GPU restent très demandés car considérés comme meilleurs que les alternatives locales. Contrairement à ses concurrents américains comme OpenAI et Google,

Les analystes et chercheurs de Huawei affirment que Ascend n’est pas encore prêt à remplacer Nvidia pour la formation des modèles en raison de problèmes techniquescomme décomposer la manière dont les puces interagissent les unes avec les autres au sein d’un « cluster » plus large de puces IA tout en entraînant des modèles de plus en plus grands. « Bien que les puces Ascend offrent de bonnes performances au niveau monopuce, la connectivité entre les puces présente un goulot d’étranglement », a déclaré Lin Qingyuan, analyste des semi-conducteurs chez Bernstein Chine. « Lorsque vous entraînez un grand modèle, vous devez le diviser en tâches plus petites. Si une puce tombe en panne, le logiciel doit trouver un moyen pour que les autres puces prennent le relais sans délai.

Convaincre les développeurs d’abandonner le logiciel Cuda de Nvidia

L’autre défi pour Huawei est de convaincre les développeurs d’abandonner le logiciel Cuda de Nvidia, connu comme la « sauce secrète » de l’entreprise car facile à utiliser pour les développeurs et capable d’accélérer considérablement le traitement des données. Mais aussi leMonter le 910Cla version mise à jour de la puce AI de Huawei, qui sera bientôt disponible, devrait résoudre ces problèmes.

Huawei et Nvidia font face à une concurrence féroce. Le groupe internet chinois Baidu et le concepteur de puces Cambricon ont fait de grands progrès dans le développement de puces IA. Parallèlement, aux États-Unis, Amazon et Microsoft parient également qu’ils pourront conquérir davantage de parts de marché dans le domaine des puces d’inférence à mesure que les applications d’IA se généraliseront.

En 2024, Nvidia a vendu 1 million de puces H20 en Chine

Selon les estimations de Semi-Analysecabinet de conseil en puces, Nvidia a réalisé 12 milliards de dollars de ventes en Chine l’année dernière en expédiant 1 million de ses puces H20 dans le pays, vendant deux fois plus de puces IA que Huawei avec son Ascend 910B. « Les GPU H20 de Nvidia spécifiques à la Chine constituent la majorité des puces IA vendues en Chine. Mais cet avantage diminue rapidement à mesure que la capacité de production de Huawei augmente », dit-il. Dylan Patelanalyste principal chez SemiAnalysis.

Les initiés préviennent que l’avancée de Huawei dans les puces IA a également été limitée par une offre insuffisante : deux clients potentiels ont déclaré qu’ils n’étaient pas en mesure d’obtenir les puces.

Les analystes estiment que la production de Huawei est probablement confrontée à des difficultés en raison des contrôles américains sur les exportations qui ont laissé les usines chinoises dépendantes d’équipements de fabrication de puces obsolètes. L’accent mis sur l’inférence indique également une dynamique évolutive de l’IA chinoise qui est différente de celle des États-Unis. Les contrôles à l’exportation de Washington signifient que les acteurs chinois de l’IA ne sont pas dans la même course que leurs rivaux de la Silicon Valley – Meta, x.AI et OpenAI d’Elon Musk – pour construire de grands méga-clusters des GPU chinois les plus avancés.

Le jeu des entreprises chinoises

« Les entreprises chinoises jouent un jeu différent. Ils accordent beaucoup plus d’attention à l’inférence que les États-Unis, car des gains d’efficacité importants peuvent être obtenus même avec des puces moins puissantes, ce qui signifie également qu’ils peuvent atteindre une commercialisation plus rapide », explique un analyste de Bernstein.

Les entreprises chinoises parient qu’elles peuvent rester compétitives dans le domaine de l’IA en réduisant le coût de l’inférence, ce qui rend l’exécution des applications d’IA moins chère.

Recherche profondebasée à Hangzhou et Pékin, a dévoilé son modèle V3qui a attiré l’attention pour ses faibles coûts de formation et d’inférence par rapport aux modèles comparatifs américains. La société a proposé une nouvelle manière par laquelle un modèle d’IA peut se concentrer de manière sélective sur des parties spécifiques des données d’entrée afin de réduire le coût d’exécution du modèle. Il a également utilisé la technique du « mélange d’experts », très répandue dans d’autres start-up chinoises d’IA, qui permet d’accélérer l’inférence car seule une partie du modèle est utilisée pour générer une réponse.

DeepSeek a déclaré que Huawei avait adapté avec succès la V3 à Ascend, fournissant des instructions détaillées aux développeurs sur la façon d’utiliser la puce.