Anthropic vient d'accuser DeepSeek et d'autres sociétés chinoises de « distiller » Claude

Anthropic vient d'accuser DeepSeek et d'autres sociétés chinoises de « distiller » Claude

Depuis des mois, nous parlons de la course entre les États-Unis et la Chine pour dominer l’intelligence artificielle comme s’il s’agissait simplement de savoir qui entraîne le modèle le plus puissant ou lance en premier la prochaine version. Mais le pouls commence à s’orienter vers un autre domaine, plus délicat : celui des règles du jeu. Lorsqu’un laboratoire en accuse un autre d’extraire des capacités de son système pour accélérer son propre développement, la discussion dépasse le cadre technique. C'est exactement ce qu'Anthropic vient de faire en dénonçant les campagnes de « distillation » contre son modèle Claude.

La plainte. Dans un texte publié ce lundi, l'entreprise affirme avoir détecté des « campagnes à l'échelle industrielle » visant à extraire les capacités de Claude. Selon leur version, les activités attribuées à DeepSeek, Moonshot et MiniMax auraient impliqué plus de 16 millions de requêtes, d'interactions questions/réponses, et auraient été canalisées via quelque 24 000 comptes frauduleux, en violation de leurs conditions de service et de leurs restrictions d'accès régionales.

La race et le soupçon. L'annonce de la firme dirigée par Darío Amodei intervient dans un contexte de tension croissante autour des progrès de l'IA chinoise. Rappelons que DeepSeek a modifié le paysage de la Silicon Valley il y a un an avec le lancement de R1, un modèle compétitif présenté comme développé à une fraction du coût des alternatives américaines. L’impact a été immédiat sur les marchés et a relancé le débat politique à Washington sur l’avantage technologique sur la Chine.

Distiller n’est pas toujours tricher. Anthropic lui-même reconnaît que la distillation est une technique courante dans le secteur. Cela consiste, en termes simples, à entraîner un modèle moins performant en utilisant les réponses générées par un modèle plus puissant, ce que les grands laboratoires utilisent pour créer des versions plus petites et moins chères de leurs propres systèmes. Le problème, selon l’entreprise, apparaît lorsque cette pratique est utilisée pour « acquérir de puissantes capacités auprès d’autres laboratoires en une fraction du temps et à une fraction du coût » qu’impliquerait leur développement indépendant. Dans ce cas, la distillation cesserait d’être une optimisation interne et deviendrait, toujours selon Anthropic, une manière de profiter du travail des autres.

Motif reconnaissable. Les trois laboratoires auraient utilisé des comptes frauduleux et des services proxy pour accéder à Claude à grande échelle tout en tentant d'éviter les systèmes de détection. L'entreprise détaille les infrastructures, ce qu'elle appelle « hydra cluster », de vastes réseaux de comptes qui répartissent le trafic entre son API et des plateformes cloud tierces, de sorte que lorsqu'un compte était bloqué, un autre prenait sa place. Anthropic soutient que ce qui différenciait ces activités de l'usage normal n'était pas une requête isolée, mais plutôt la répétition massive et coordonnée de requêtes visant à extraire des capacités très spécifiques du modèle.

Trois campagnes. Même si Anthropic présente les campagnes comme s’inscrivant dans une même dynamique, elle distingue des nuances pertinentes. DeepSeek aurait concentré ses plus de 150 000 requêtes sur l’extraction de capacités de raisonnement et la génération d’alternatives sûres aux questions politiquement sensibles. Moonshot, avec plus de 3,4 millions de requêtes, aurait été orienté vers le développement d'agents capables d'utiliser des outils et de manipuler des environnements informatiques. MiniMax concentrerait le plus gros volume, plus de 13 millions de requêtes, et selon le récit d'Anthropic, il aurait réagi en quelques heures au lancement d'un nouveau système, redirigeant son trafic pour tenter d'extraire les capacités de son système le plus récent.

Un enjeu géopolitique. La société affirme que les modèles distillés illicitement pourraient perdre les garanties visant à empêcher les acteurs étatiques ou non étatiques d’utiliser l’IA à des fins telles que le développement d’armes biologiques ou des campagnes de désinformation. Il soutient également que la distillation affaiblit les contrôles à l'exportation en permettant aux laboratoires étrangers de raccourcir les distances par d'autres moyens, tout en reconnaissant que la réalisation de ces extractions à grande échelle nécessite l'accès à des puces avancées, renforçant ainsi la logique de restriction de leur disponibilité et, en même temps, rappelant que le risque augmenterait si ces capacités finissaient par être intégrées dans des systèmes militaires, de renseignement ou de surveillance.

Images | Simseo avec Nano Banana Pro

À Simseo | Seedance est la plus grande brutalité que nous ayons vue générer de la vidéo. Et il a un message inconfortable : il a surpassé Sora et Veo sans puces NVIDIA.