Deepseek a dû tirer l’ingéniosité pure, brisant le paradigme « plus = meilleur »
Satya Nadella, directrice générale de Microsoft, est très claire: « Le nouveau modèle de Deepseek est vraiment impressionnant à la fois par la façon dont ils ont efficacement développé un modèle d’intelligence artificielle (IA) open source qui effectue des calculs en temps d’inférence comme pour son incroyable efficacité de calcul. Nous devons prendre les développements de la Chine très, très au sérieux (…) car IA devient plus efficace et accessible, nous verrons que son utilisation déclenche, devenant une marchandise dont nous ne pouvons pas nous passer.
Dans cette déclaration à Fortune, Nadella accorde au triomphe technologique que la société chinoise Deepseek a atteint. Et il l’honore qu’il le reconnaît sans ambiguïté, surtout si nous gardons à l’esprit que Microsoft est l’un des concurrents de l’industrie de l’IA qui vient de voir comment sa valeur en bourse est tombée brutale après la manière brutale après la Irruption de l’irruption de Deepseek R1. Quoi qu’il en soit, nous pouvons être sûrs que dans une large mesure, ce modèle d’IA est le résultat de la pression que les sanctions américaines exercent sur les entreprises chinoises.
Jensen Huang, fondateur et directeur général de Nvidia, l’a prévu dans l’une des déclarations qu’il a faites à la fin du mois de mai 2023 dans Computex: « La Chine consacre les ressources de masse à la mise en œuvre de sociétés émergentes spécialisées dans le développement de GPU ne sous-estime pas eux. » Cet avertissement visait le gouvernement américain dans une tentative claire de l’empêcher sur les conséquences qui auront les sanctions qui cherchent à arrêter le développement technologique de la Chine. Huang parle des concepteurs chinois GPU, mais sa déclaration peut être extrapolée aux entreprises chinoises qui développent des modèles d’IA. Après tout, dans ce domaine, les GPU et les modèles de langues grands vont de pair.
Les États-Unis continueront à diriger dans l’IA
Une bonne partie des sanctions approuvées par l’administration dirigée par Joe Biden au 7 octobre 2022 cherche à ralentir le développement de l’industrie chinoise des semi-conducteurs, ainsi que sa technologie d’IA. En fait, comme nous venons de le voir, les circuits intégrés et l’IA vont de pair. Ces interdictions empêchent Nvidia, AMD ou Intel, entre autres fabricants de puces pour les applications d’IA, vendent leur GPU le plus avancé à leurs clients chinois. Il s’agit probablement du germe de la plus grande réussite de Deepseek.
Selon Depseek, l’infrastructure a utilisé pour former son modèle AI 2 048 NVIDIA H800 Chips
Si nous nous en tenons à l’information que cette entreprise chinoise a utilisé l’infrastructure utilisée pour former Depseek R1 Agglutina 2 048 NVIDIA H800 Chips. Et la formation avec 671 000 millions de paramètres a coûté 5,6 millions de dollars. C’est précisément ce que Satya Nadella parle dans les déclarations que nous avons examinées quelques lignes ci-dessus. Ces chiffres sont extrêmement retenus. Certains analystes défendent que, en réalité, leur infrastructure Agglutina 50 000 GPU H100 achetée via des intermédiaires, mais pour le moment, ce n’est qu’une conjecture.
Si nous donnons les déclarations faites par les porte-parole de Deepseek au Financial Times, et pour le moment il est raisonnable de le faire, la raison pour laquelle leurs ingénieurs ont mis en place leur infrastructure de formation sur les GPU NVIDIA H800 est que les sanctions américaines, ils les ont empêchés d’accéder à H100 H100 Chips, qui sont plus puissants. Les interdictions du 16 novembre 2023 empêchent Nvidia de livrer à leurs clients chinois les GPU H800, mais à ce moment-là, Deepseek avait déjà monté son infrastructure. En tout cas, dans cette situation, le méritoire est qu’avec une puce relativement modeste, cette entreprise chinoise a matérialisé une réalisation remarquable.
Le succès incontesté de DePseek est une victoire pour la Chine, mais c’est une victoire partielle. Cette guerre technologique en ce moment gagne les États-Unis. Son avantage réside dans une réalité non aperçable: le pays dirigé par Donald Trump contrôle tellement La plupart des fabricants de GPU Comme de nombreuses entreprises qui se consacrent au développement de modèles d’IA. Et ces derniers ont accès sans restrictions sur les GPU les plus avancés produits par NVIDIA et d’autres sociétés.
La Chine a les GPU Huawei, qui semblent être très compétitifs dans les processus d’inférence, ainsi que ceux d’entreprises telles que Moore Threads, Metax, Biren Technology, Innosilicon, Zhaoxin, Iluvatar Corex, Denglinai ou vaste technologie AI, entre autres. Mais, pour le moment, il est dans une position de désavantage clair. Même ainsi, cette confrontation va longtemps, donc toute conclusion que nous arrivons à ce que le pays s’impose enfin dans le domaine de l’IA, le cas échéant, ce serait prématuré.
Image | Nvidia
Plus d’informations | Fortune | Temps financier
Dans Simseo | La Chine surveille étroitement le mouvement américain avec Stargate. Et votre réponse a déjà préparé
