Lorsque les États-Unis ont bloqué leurs puces d’IA les plus avancées destinées à la Chine, ils ont cru qu’ils lui faisaient du mal. Le résultat a été le contraire
Le mois dernier, les modèles d'IA chinois ont dépassé les modèles américains utilisés sur OpenRouter, une plateforme d'IA qui vous permet de détecter des tendances intéressantes. Et cela vient en fait de se confirmer ce mois-ci et s'est accéléré, car ce que nous constatons, c'est que malgré les obstacles que les États-Unis ont tenté de mettre en place pour empêcher la Chine de rivaliser sur ce marché, le géant asiatique a trouvé une tactique clé pour y parvenir : la soi-disant « exportation symbolique ».
Des tarifs inutiles. Le gouvernement américain a mis fin à l’ère de la mondialisation avec sa guerre commerciale avec la Chine et, plus récemment, avec sa politique tarifaire agressive. Cela a eu un effet évident sur les exportations chinoises, mais le pays asiatique a trouvé un moyen d’éviter les droits de douane : avec l’IA. Ses modèles d’intelligence artificielle peuvent être utilisés partout dans le monde sans être affectés par les tarifs douaniers. Bien qu’ils soient inférieurs en termes de performances et de qualité, ils sont beaucoup moins chers à utiliser. La Chine parvient donc à convaincre le monde avec sa vieille recette : si le produit ou le service est suffisamment bon et bon marché, elle gagne.

Sur la plateforme OpenRouter, nous constatons depuis deux mois que les modèles chinois sont plus utilisés que ceux des États-Unis pour une raison simple : ils sont beaucoup moins chers et fonctionnent raisonnablement bien.
Exportation de jetons. Lorsque nous consommons de l'énergie, nous consommons des kilowatts. Lorsque nous utilisons l'IA, nous consommons des jetons provenant de modèles d'IA. Et c’est là que la Chine gagne avec le phénomène appelé « exportation de jetons », car les jetons de ses modèles d’IA sont extrêmement compétitifs et ces modèles sont suffisants pour de nombreuses tâches. Minimax M2.5, Step 3.5 Flash ou DeepSeek V3.2 ont clairement surpassé Gemini 3 Flash Preview, Claude Sonnet 4.6 ou Claude Opus 4.6 utilisés ces deux derniers mois sur la plateforme OpenRouter par exemple. Les développeurs du monde entier profitent de ces modèles et le font sans être affectés par les tarifs : les tokens ne paient pas les frais qui s'appliquent, par exemple, aux téléphones portables, aux voitures et à de nombreux autres produits.


Différence de prix dévastatrice. Alors qu'un modèle américain haut de gamme comme Claude Opus 4.6 coûte 5 dollars par million de jetons d'entrée (le Sonnet 4.6 en coûte 3), les modèles chinois comme le MiniMax M2.5 coûtent aussi peu que 0,25 dollars, soit 20 fois moins, et le Step 3.5 Flash, également très populaire, ne coûte que 0,10 dollars, soit 50 fois moins.
Les agents IA demandent des modèles bon marché. Cet écart de prix est particulièrement pertinent aujourd’hui alors que les agents d’IA, et en particulier OpenClaw, commencent à démontrer leurs capacités. Ces types de systèmes sont capables d'accomplir des tâches pour nous et même de contrôler les machines auxquelles nous leur donnons accès, mais pour y parvenir, ils utilisent une énorme quantité de jetons. Utiliser les meilleurs modèles garantit de meilleurs résultats, mais cela coûte aussi très cher, mais dans de nombreuses tâches « simples », des modèles très bon marché comme ceux chinois peuvent parfaitement résoudre le problème.

Le piège de l’abonnement. Ces dernières semaines, la montée en puissance d’OpenClaw et de plateformes similaires a provoqué une curieuse réponse de la part d’entreprises comme Anthropic ou Google. Ces entreprises n'aiment pas que les plans d'abonnement à leurs modèles d'IA soient utilisés pour ces types d'agents d'IA, car elles soutiennent que ces plans sont abusés et qu'il existe certaines restrictions sur ce type d'utilisation. Cela a amené de nombreux utilisateurs à opter pour des modèles d'IA d'entreprises chinoises, qui se positionnent précisément comme l'alternative bon marché et sans problème pour pouvoir profiter de ces agents.
Pourquoi les jetons chinois sont si bon marché. Plusieurs facteurs favorisent le faible coût des modèles d’IA en Chine. Le premier d’entre eux, l’énergie bon marché : les coûts de l’énergie industrielle sont 40 % inférieurs à ceux des États-Unis. Le second, son architecture efficace : comme DeepSeek l'a démontré, il est possible d'obtenir d'excellents résultats avec des techniques telles que le mélange d'experts (MoE). Grâce à lui, le modèle est divisé en plusieurs « experts » et n'active que ceux qui sont nécessaires en fonction de la demande.
L'ironie des tarifs. Curieusement, les restrictions américaines sur l’exportation de puces avancées pourraient avoir fini par être le grand catalyseur de cette situation. En n'ayant pas accès aux puces NVIDIA les plus avancées, les entreprises chinoises ont été obligées de perfectionner au maximum l'efficacité de leurs modèles, ce qui les a amenées à être désormais plus compétitives sur le marché de l'inférence de l'IA (celui de l'utilisation des modèles dans la pratique), où se livre cette nouvelle bataille économique.
Défis. Bien que les « exportations symboliques » soient actuellement rentables pour la Chine, elles se heurtent à des défis importants. La souveraineté des données en fait partie : pour une entreprise ou un gouvernement, envoyer des données sensibles vers des centres de données en Chine est une ligne rouge. Il y a aussi le problème de la latence : la réponse des modèles d’IA chinois est affectée par les énormes distances que ces paquets de données doivent parcourir. Il reste à voir si Washington finira par appliquer une sorte de mesure pour restreindre également l’utilisation des modèles d’IA des entreprises chinoises, même si cela semble plus compliqué.
À Simseo | NVIDIA a déjà le monopole du matériel d'IA : elle veut désormais conquérir les logiciels via des agents
