Le problème c’est que depuis sa « révolution » il y a un an, d’autres IA l’ont dépassée
DeepSeek a publié son modèle V4 sous licence MIT, avec des améliorations notables du code et de l’architecture conçues pour les puces chinoises. Elle a également admis, dans son propre rapport technique, qu’elle accusait un retard de trois à six mois sur les principaux modèles occidentaux.
Pour un laboratoire qui, il y a un peu plus d’un an, a changé le discours mondial sur l’IA, c’est bien plus qu’une nuance.
Pourquoi c’est important. DeepSeek est devenu un symbole en janvier 2025. Son moment a ébranlé les marchés, remis en question la logique du marché boursier technologique américain et convaincu la moitié du monde que la Chine pouvait rivaliser face à face à la frontière de l’IA, à une fraction du coût.
Ce n’est pas que la V4 détruit cette histoire, mais elle la complique un peu. Le laboratoire d’IA le plus important de Chine arrive avec un modèle que ses propres ingénieurs décrivent comme une étape et non comme un saut.
Le contexte. La V4 a mis plus de temps que prévu à arriver. Selon des sources industrielles rapportées par 36Kr, DeepSeek a subi un grave échec de formation à la mi-2025 alors qu’il tentait de migrer son infrastructure NVIDIA vers les puces Ascend de Huawei.
Les points de vue internes sur la direction technique n’étaient pas alignés et le fondateur Liang Wenfeng a imposé des conditions qui se sont avérées difficiles à exécuter. Résultat : des mois de retard et un modèle qui, par ailleurs, n’est toujours pas multimodal, reporté faute de capacité de calcul et de trésorerie.
Entre les lignes. La chose la plus intéressante à propos de la V4 réside dans son architecture. Le modèle introduit TileLang, un langage spécifique à un domaine qui permet de découpler le code de bas niveau de CUDA (la norme NVIDIA) et de le compiler pour différentes puces.
Il intègre également MegaMoE, un expert conçu pour réduire la latence en parallélisme et qui fonctionne déjà sur le matériel Ascend. Mais la formation V4 a continué à utiliser les GPU NVIDIA. L’indépendance est, pour l’instant, plus une aspiration qu’un fait accompli.
tournant. Tandis que DeepSeek regardait vers l’intérieur, le marché chinois se réorganisait sans lui :
- Doubao de ByteDance est devenu le chatbot le plus téléchargé en Chine.
- MiniMax et Z.ai sont devenus publics.
- Alibaba a connu une grande adoption grâce aux applications verticales.
DeepSeek n’a jamais voulu créer un produit de consommation et le marché ne l’a pas attendu.
La facture interne est également arrivée : le laboratoire a perdu des talents clés au profit de Tencent, ByteDance et Xiaomi dans pratiquement tous les domaines. Liang Wenfeng a refusé de céder 20 % à un grand investisseur non identifié. Et maintenant, pour la première fois, DeepSeek ouvre un cycle de financement externe.
Grand perdant ? Le discours selon lequel la Chine est une véritable alternative au modèle occidental fermé en a pris un coup. Un employé de Qwen a déclaré à 36Kr que « l’âge d’or du développement de l’IA à but non lucratif est révolu ».
La grande question. Il s’agit de savoir si DeepSeek peut regagner le terrain perdu. Cela dépend en grande partie de Huawei, dont l’Ascend 950 promet de bien évoluer avec la V4, mais 750 000 unités équivalent, ajustées en fonction de la qualité, à une semaine de production américaine. L’écart n’est pas comblé avec des architectures ingénieuses. Il est fermé avec du silicium.
À Simseo | Les entreprises du monde entier sont confrontées à un dilemme insoluble : soit elles sont avec la Chine, soit avec les États-Unis, avec les deux, ce n’est plus possible.
Image en vedette | Solen Feyissa
