Anthropic n’a pas augmenté le prix de Claude. Il a inventé quelque chose de mieux : l’inflation symbolique
« Ne t’inquiète pas, ça coûte le même prix. » C’était le message d’Anthropic en annonçant le lancement de son nouveau modèle d’IA, Claude Opus 4.7. Dans cette déclaration, ils ont clairement indiqué que « le prix reste le même que celui de l’Opus 4.6 : 5 $ par million de jetons d’entrée et 25 $ par million de jetons de sortie ». Il y avait cependant des petits caractères, car le modèle est meilleur mais pour y parvenir il raisonne davantage, et cela signifie une chose : plus de jetons. Et plus vous consommez de tokens, plus la facture de l’IA augmente.
Anthropique déjà prévenu. Il convient de noter que dans cette annonce officielle, Anthropic n’a pas caché les faits. Dans l’un des paragraphes, il explique clairement comment l’Opus 4.7 « pense plus » et cela a un impact direct sur la consommation de tokens (nous soulignons la différence en gras) :
« Opus 4.7 est une mise à jour directe de l’Opus 4.6, mais il y a deux changements à garder à l’esprit car ils affectent l’utilisation des jetons. Premièrement, l’Opus 4.7 utilise un tokenizer mis à jour qui améliore le traitement du texte par le modèle. Cela signifie que la même entrée peut générer plus de jetons (environ 1,0 à 1,35 fois plus, selon le type de contenu). Deuxièmement, l’Opus 4.7 effectue une analyse plus approfondie des niveaux d’effort. Cela améliore sa fiabilité dans des problèmes complexes, mais cela signifie également la génération de davantage de jetons de sortie.
Ou ce qui est pareil : lorsqu’il répond, l’Opus 4.7 utilise beaucoup plus de jetons que son prédécesseur, et c’est important car les jetons de sortie sont beaucoup plus chers que ceux d’entrée. Dans le cas précis de l’Opus 4.7, cinq fois plus cher (5$ contre 25$).
Qu’est-ce qu’un tokenizer et pourquoi est-ce important ? Les grands modèles linguistiques (LLM) ne traitent pas le texte directement, mais le convertissent plutôt en unités appelées jetons, qui sont des fragments de mots, de symboles ou de caractères. Le tokenizer est le mécanisme qui effectue cette conversion. Anthropic a décidé de mettre à jour le tokenizer dans Opus 4.7, arguant que son nouveau système améliore la façon dont le texte est traité. Conséquence directe : le prompt qui générait auparavant 1 000 tokens en génère désormais jusqu’à 1 350. Et comme il est facturé par token, le coût effectif augmente même si le prix par token est resté le même.
Confirmé par des tiers. Simon Willison, analyste et vulgarisateur bien connu dans ce domaine, a créé un outil pour mesurer la différence de consommation de tokens avec l’API Claude Opus 4.6 et 4.7. Il a pris l’invite système officielle de l’Opus 4.7 et l’a exécuté sur les deux modèles :
- Avec Opus 4.6, il a généré 5 039 jetons de sortie
- Avec Opus 4.7, il a généré 7 335 jetons de sortie
Cela représente une croissance de 1,46x tokens entre Opus 4.6 et Opus 4.7, encore supérieure à celle indiquée par Anthropic (1,35x). Pour les images, la différence est encore plus extrême puisque la consommation de jetons peut atteindre 3,01x. Il y a ici une précision importante, car les images sont prises en charge jusqu’à 3,75 Mpixels et une résolution plus élevée entraîne une augmentation significative de la consommation.


Bill Chambers, un autre utilisateur de X, a publié un autre outil appelé Tokenomics qui vous permet également de comparer la consommation de jetons entre les deux modèles avec n’importe quelle invite. Le classement global de tous les utilisateurs qui ont essayé cet outil montre que l’augmentation moyenne est de 38,6 %, tout à fait conforme à ce que souligne Anthropic.
Et réfléchissez aussi davantage. Comme nous l’avons dit, ce nouveau modèle applique deux changements dans sa manière d’agir. Le premier est le tokenizer susmentionné : la même entrée est convertie en plusieurs jetons d’entrée. La seconde est le fait que le modèle « réfléchit désormais davantage » avant de réagir, ce qui signifie davantage de consommation de jetons. L’Opus 4.7 arrive avec un nouveau niveau « d’effort » appelé xhigh, situé entre high et max. Anthropic a décidé que désormais l’effort par défaut serait précisément xélevé pour tous les plans, de sorte que les deux mécanismes contribuent à cette consommation de jetons plus élevée. Comme l’indique Anthropic lui-même,
« L’Opus 4.7 pense davantage aux niveaux d’effort élevés, en particulier lors des tours ultérieurs dans les environnements agents. Cela améliore sa fiabilité sur les problèmes difficiles, mais cela signifie qu’il produit plus de jetons de sortie. »
Critiques sur les réseaux. La réaction des utilisateurs a été claire et il existe divers exemples sur des réseaux tels que X ou Reddit dans lesquels ces utilisateurs critiquent les changements. Sur Reddit, un fil de discussion intitulé « L’Opus 4.7 est une régression sérieuse, pas une amélioration » compte déjà 3 200 votes et 800 commentaires qui résument que ce nouveau modèle ignore les instructions, hallucine et ment, est « plus bête », est devenu trop complaisant, voire paresseux, et « parle trop », ce qui contribue également au coût de chaque consultation.


Beaucoup se plaignent du fait que leurs limites payantes Pro et Max s’épuisent plus rapidement qu’avant en raison de ces changements. Certains utilisateurs affirment que l’Opus 4.7 est le premier signe qu’Anthropic a peut-être agi trop rapidement pour la première fois lorsqu’il s’agissait de lancer un nouveau modèle.


Anthropique réagit. Les critiques sur le coût et le comportement du modèle ont poussé les responsables d’Anthropic à tenter de clarifier les choses. Borys Cherny a retweeté un message de l’entreprise qui expliquait comment le paramètre « /usage » dans Claude Code nous permettait de montrer à quel genre de choses notre API ou notre plan d’utilisation est dépensé. Ce même ingénieur, qui est le principal responsable du développement du Code Claude susmentionné, a également indiqué que puisque son nouveau modèle utilise désormais plus de jetons, Anthropic avait augmenté les quotas d’utilisation des modèles, mais sans donner de détails précis.


Le motif répétitif. Il y a quelques semaines, la communauté des utilisateurs s’est plainte d’avoir remarqué une « régression » dans le comportement de l’Opus 4.6. Bien qu’il soit impossible de le vérifier ou de le valider, de nombreux utilisateurs se sont plaints en ligne de la détérioration des performances du modèle lors de leurs tests. Maintenant, ils viennent de lancer un modèle qui promet d’être meilleur que le précédent, mais qui finit par coûter plus cher à utiliser si vous n’y faites pas attention. Les deux événements dessinent un schéma : Anthropic augmente ses revenus sans annoncer d’augmentation de prix en tant que telle.
Ce que les utilisateurs peuvent faire. S’il est vrai que l’Opus 4.7 consomme plus de tokens par défaut, il est possible de procéder à quelques ajustements pour tenter de contenir les coûts. Le paramètre effort permet de réduire ce paramètre de xélevé à élevé voire moyen pour des tâches qui nécessitent moins de raisonnement. Il existe également de nouvelles façons de définir des « budgets de tâches » pour limiter les jetons utilisés dans certains processus, et pour les images, nous pouvons réduire la résolution de sortie. De plus, Opus 4.6 est toujours disponible pour le moment, nous pouvons donc opter pour celui-ci (ou Sonnet 4.6) si nous pensons que cette version en vaut la peine pour nous. L’autre alternative, bien sûr, consiste à utiliser d’autres modèles d’IA qui fonctionnent bien pour nous et qui sont plus abordables, à la fois dans le cloud et sur site.
Simseo | Anthropic était le « ne soyez pas méchant » de l’IA pour les développeurs. Maintenant, il les serre tous
