Seuls les talents chinois recrutent et paient plus de 1,3 million de dollars

Le matériel utilisé par DePseek pour former son modèle d’intelligence artificielle (IA) ouverte continue de générer de la méfiance. Si nous nous en tenons à l’information que cette entreprise chinoise a fabriqué l’infrastructure utilisée pour former Deepseek R1 Agglutina 2 048 puces Nvidia H800. Et la formation avec 671 000 millions de paramètres a coûté 5,6 millions de dollars. Cependant, certains analystes défendent que ces chiffres ne reflètent pas la réalité.

Le rapport très juteux préparé par semianalyse soutient que, en réalité, l’infrastructure utilisée par DePseek pour former son modèle AI rassemble environ 50 000 NVIDIA GPU avec du Microarquitectura Hopper. Selon Dylan Patel, AJ Kourabi, Doug O’Laughlin et Reyk Knuhttsen, au moins 10 000 de ces jetons sont le GPU NVIDIA H100, et au moins 10 000 autres 10 000 autres sont le GPU H800. Selon ces analystes, les énigmes restantes sont les GPU garantis H20.

Étant vrai, le coût réel de la formation R1 profonde devrait être beaucoup plus élevé. Patel et ses collègues disent que l’investissement total fait par cette société chinoise sur les serveurs s’élève à environ 1,6 milliard de dollars. Cette infrastructure est distribuée à plusieurs endroits et n’est pas utilisée uniquement pour former des modèles d’IA; Il est également utilisé, toujours selon la semianalyse, pour la recherche financière et la modélisation.

Huawei renforce sa position dans le processus d’inférence

Quel que soit Deepseek a deux bazas très importants en sa faveur qui ne valent pas de négliger. Le premier est que, comme nous venons de le voir, il exploite sa propre infrastructure de traitement. D’autres entreprises émergentes qui ont une vocation similaire sont obligées de recourir aux fermes des grands fournisseurs de services cloud. Avoir votre propre matériel permet à Deepseek d’être très efficace pendant le processus de développement et d’optimisation de vos modèles d’IA.

Deepseek recrute des ingénieurs exclusivement en Chine continentale et ne les cherche pas également aux États-Unis ou à Taïwan

Son deuxième atout est sa stratégie d’acquisition de talents. Et c’est que Deepseek recrute des ingénieurs exclusivement en Chine continentale et ne les recherche pas également aux États-Unis ou à Taïwan, comme le font d’autres entreprises chinoises similaires. De plus, payez très bien: Plus de 1,3 million de dollars par an À ses meilleurs chercheurs. Cette stratégie renversée dans l’acquisition de talents a permis à Deepseek de matérialiser des innovations importantes dans le domaine de l’IA et de hiérarchiser l’efficacité au-dessus de l’amélioration par la force brute.

De plus, et il est également important que nous ne le négligeons pas, Depseek ne dépend pas complètement du matériel NVIDIA. Les GPU pour l’IA développés par Huawei, tels que les puces Ascend 910C, montrent que c’est très efficace dans les processus d’inférence. L’inférence est, dans des accidents vasculaires cérébraux, le processus de calcul effectué par des modèles de langage dans le but de générer les réponses qui correspondent aux demandes qu’ils reçoivent. Précisément Huawei et Siliconflow, qui est également la Chine et consacré au déploiement des infrastructures, sont responsables de Deepseek V3 et R1 sont disponibles à grande échelle pour les utilisateurs de la planète entière.

Plus d’informations | Semi-santé | SCCP

Dans Simseo | La Chine surveille étroitement le mouvement américain avec Stargate. Et votre réponse a déjà préparé