Les tarifs forfaitaires de l’IA pour la programmation sont mathématiquement insoutenables

Les tarifs forfaitaires de l’IA pour la programmation sont mathématiquement insoutenables

Un utilisateur de Claude Max, payant 100 $ par mois, a généré 5 600 $ de coûts réels d’API en un seul cycle de facturation. Ce n’est qu’un exemple (extrême) de l’énorme écart entre le prix d’un tel plan et son potentiel de dépenses. D’autres analyses le situent entre 1 000 et 5 000 dollars.

Anthropic vient de couper l’accès des outils tiers (comme OpenClaw) à ses formules d’abonnement. En plus de protéger votre jardin clôturé, c’est aussi la conséquence arithmétique inévitable de vendre à prix buffet alors que la consommation réelle a grimpé entre 10 et 100 fois.

Pourquoi c’est important. Le modèle économique qui a financé l’explosion de l’IA pour les programmeurs (forfaits, accès illimité, modèle d’abonnement) s’est construit sur une fiction statistique que les agents de développement ont détruite.

Ce qui est supposé lorsqu’un tarif forfaitaire est vendu dans n’importe quelle zone, c’est que les utilisateurs légers subventionnent les plus intensifs et que les moyennes sont maintenues. Cela fonctionne dans les débits de données des télécommunications, dans les salles de sport, sur Netflix et dans un buffet à volonté. Mais cela ne fonctionne pas quand n’importe quel utilisateur peut devenir, du jour au lendemain, un bestial consommateur d’informatique. Et c’est exactement ce qui se passe lorsqu’un agent entre en jeu. Et depuis décembre, nous sommes à l’ère des agents.

Entre les lignes. La personne qui a le mieux expliqué ce problème est Luo Fuli, chef de l’équipe modèle MiMo chez Xiaomi et ex-DeepSeek, qui a publié un long tweet qui a particulièrement ému dans les cercles technologiques chinois.

Leur diagnostic est que les outils tiers comme OpenClaw ne sont pas optimisés pour réutiliser le cache contextuel de Claude, donc chaque requête régénère plus de 100 000 fenêtres contextuelles à partir de zéro. Le nombre réel de requêtes par requête est plusieurs fois supérieur à ce que Claude Code lui-même générerait. « Ce n’est pas une brèche. C’est un cratère », a déclaré Luo.

La toile de fond. En Chine, les plans de programmation d’IA sont devenus l’un des produits technologiques les plus recherchés du marché. Les emplacements d’Alibaba Cloud sont généralement épuisés dès les premières heures de la journée ouvrable, et ceux de Tencent sont répertoriés en permanence comme « indisponibles ».

Les développeurs définissent même des alarmes matinales et écrivent des achats automatiques pour obtenir un accès mensuel. La demande est réelle, mais les facteurs économiques sous-jacents vont dans la direction opposée : les formules d’abonnement, conçues pour un monde où chaque interaction en consommait quelques centaines, absorbent désormais des charges de travail des agents qui consomment 10 à 100 fois plus par tâche.

Oui, mais. Anthropic n’a pas fermé l’accès aux agents tiers. Vous les avez déplacés vers une autre facture : du forfait à l’API de paiement à l’utilisation. La mesure comprend un crédit unique équivalent au prix mensuel du forfait et des réductions allant jusqu’à 30 % pour ceux qui achètent à l’avance des forfaits « usage supplémentaire ».

Le problème est que pour de nombreux développeurs indépendants, la hausse des coûts, potentiellement décuplée, rend le recours aux agents n’est plus économiquement viable. Certains ont déjà annoncé qu’ils allaient migrer vers d’autres modèles. Quelqu’un doit payer pour cette fête, et jusqu’à ce qu’une nouvelle solution plus efficace arrive, personne ne sait de qui il s’agira.

La grande question. Si le tarif forfaitaire ne peut pas survivre à l’utilisation réelle des agents, quel modèle de tarification le fera ? Luo Fuli estime que la pression économique finira par obliger les développeurs d’outils tiers à optimiser leur gestion du contexte et à maximiser la réutilisation du cache.

Il a peut-être raison et son approche est logique. Mais en attendant, l’ensemble du secteur fonctionne avec un modèle économique dont les calculs ne tiennent pas, et la question de savoir qui absorbera la différence (fournisseurs, développeurs ou utilisateurs finaux) reste sans réponse.

À Simseo | Les entreprises investissent dans l’IA depuis des années. Le problème est que de nombreux projets ne produisent pas de résultats.

Image en vedette | Fotis Fotopoulos