La Chine a les modèles les moins chers, les plus puissants. Ceux d'entre nous qui gagnent sont des utilisateurs

Le 20 mai, Google a lancé Gemini 2.5 Pro et Gemini 2.5 Flash en version préliminaire. Ces nouveaux modèles d'IA étaient meilleurs que jamais et pour démontrer la société incluse dans son annonce plusieurs graphiques et tables comparatives.

Ils ont examiné comment les deux ont dépassé leurs rivaux à la fois dans le domaine du raisonnement et dans les performances traditionnelles (repères de mathématiques ou de programmation), mais il y avait aussi un autre fait que Google présume: Google: Le coût de Gemini 2.5 Flash.

Capture d'écran 2025 05 30 à 13 09 46

Source: Google.

Ce tableau publié par Google a clairement indiqué que Gemini 2.5 Flash était clairement le gagnant de cette comparaison dans le rapport des prix / avantages importants. Ce que Google n'a pas dit, c'est que ce succès de ce modèle était l'exception à la règle, car dans cette course pour avoir des modèles bon marché et puissants, La Chine semble prendre les devants.

Il le fait au moins si nous nous occupons du coût de l'utilisation de ces modèles. Dans Simseo, nous avons analysé ce coût basé sur le prix des abonnements pour les utilisateurs finaux, mais sur le coût d'accès à l'API, qui permet aux développeurs d'intégrer ces modèles dans leurs propres chatbots et leurs services.

Les prix de l'API de chaque modèle différencient clairement deux utilisations de l'intelligence artificielle. D'une part, combien cela coûte-t-il pour écrire quelque chose pour que le modèle le traite ensuite (les jetons d'entrée SO). De l'autre, combien le texte généré par le modèle a-t-il traité la réponse (les jetons de sortie SO).

Les jetons d'entrée Ils sont généralement cinq fois moins chers que la sortieparce que le traitement de la demande et la génération de texte coûte beaucoup plus cher que de le recevoir, de l'analyse et de la «compréhension». Nous voulions comparer le coût des principaux modèles de l'IA développés en Chine et ceux des États-Unis, et bien que comme toujours, ne le sont pas, s'ils sont tous. Le tableau résultant est le suivant:

Ces prix sont publics et très faciles à trouver dans le cas des modèles AI américains (Openai, Anthropic, Google) mais pas tant dans le cas des modèles chinois (Deepseek, Qwen (Alibaba), Doubao (Bytedance), GLM-4 (Zhipu), Ernie (Baidu)).

Quoi qu'il en soit, la table, commandée du moins cher au plus cher, démontre qu'aujourd'hui les modèles chinois sont particulièrement bon marché. Seul Gemini 2.5 Flash Preview parvient à concourir – et le fait exceptionnellement. Dans le reste des cas, les modèles d'IA en Chine remportent la bataille pour le coût.

Il faut noter que, Comme toutes les comparaisons, c'est injuste. Et c'est parce que ce tableau ne prend pas en compte les avantages de chaque modèle. Openai O3 et Anthropic Claude Opus 4, les derniers et les modèles les plus puissants de ces entreprises, sont particulièrement précis dans leurs réponses, mais chaque consultation consomme beaucoup plus de ressources (calcul, énergie) et cela rend logique qu'ils sont beaucoup plus chers que leurs concurrents.

Nous savions que nous, Big Tech, avait un problème avec les coûts de leur IA. Deepseek vient de montrer dans quelle mesure

Mais ces modèles sont également conçus pour des cas très spéciaux et pour des consultations spécialisées, détaillées et profondes. Dans la grande majorité des cas, il n'est pas nécessaire d'utiliser ces modèles, et c'est là qu'ils sont en concurrence, par exemple Deepseek R1 ou Gemini 2.5 Flash Preview: dans le rapport prix / avantages.

Modèles à prix variables

Cette bataille de prix nous a fait voir ces derniers temps deux techniques que certaines entreprises s'appliquent aux prix de l'utilisation de leurs API. Le premier consiste à différencier les entrées normales et les sorties du cache d'entrées (et même quitte).

Prix de l'API Deepseek. Attentif en bas à gauche: Selon le moment où vous les utilisez, ils peuvent laisser moins cher. Source: Deepseek.

L'explication est simple: une entrée « normale » est une demande ou une question que le modèle n'a jamais traité et doit donc traiter complètement. Si l'entrée a été capturée (hit de cache) est due au fait que cette demande a été traitée dans le passé, le système peut donc obtenir la réponse de son cache, ce qui réduit considérablement les coûts de calcul. Deepseek, Google, Anthropic et OpenAI offrent ce type d'option, comme on peut le voir dans le tableau.

La deuxième technique consiste à utiliser des prix variables en fonction (pour le moment) du créneau horaire dans lequel nous utilisons ces modèles. C'est ce que Deepseek a fait, qui a des prix de « jour » et de « nuit » selon le calendrier de l'UTC. Si vous utilisez l'API DePseek de 18h30 à 14h30 (horaire péninsulaire en Espagne), ce sera à moitié prix.

Bonne nouvelle: l'IA est à chaque fois (beaucoup) moins cher

Alors que la Chine et le combat américain qui ont le modèle le plus puissant ou qui a le modèle le moins cher, ce qui se passe constamment, c'est que le prix de l'IA baisse remarquablement.

Capture d'écran 2025 05 30 à 14 13 34

C'est une observation que plusieurs experts comme Ethan Mollick, professeur à l'Université de Pennsylvanie qui a récemment analysé comment Ce ratio prix / avantages ne fait que s'améliorer. Les modèles s'améliorent et sont moins chers.

Capture d'écran 2025 05 30 à 14 15 50

D'autres experts tels que Raveesh Bhalla – expliqués par Netflix et LinkedIn – ont également reflété cette évolution au début de l'année. Puis il a montré comment le coût d'un modèle de niveau O1 avait baissé 27 fois au cours des trois derniers mois. De plus, à ce rythme, les modèles de niveau GPT4 – qui il y a un an étaient des référents absolus – seront réduits 1 000 fois en seulement 18 mois.

Capture d'écran 2025 05 30 à 12 25 05

Nous le vivons dans la réduction des prix. Dane Bahey, d'Openai, a déclaré lors d'une conférence en septembre de l'année dernière comment le coût par million de jetons était passé de 36 $ à seulement 0,25 $ au cours des 18 derniers mois. Et cette baisse de prix est toujours claire et fantastique pour les utilisateurs.

Ainsi, nous sommes confrontés à une carrière qui a actuellement beaucoup d'étirements: les modèles de la Chine portent l'avance si nous ne nous occupons qu'à leur coût, mais prudent, car nous devons également prendre en compte les avantages. Il est vrai que ces modèles chinois se sont déjà montrés dans les repères qui ont montré qu'ils concourent de vous avec les meilleurs modèles américains, et il reste maintenant à voir qui finira par emmener le chat à l'eau.

Pour l'instant, oui, Il y a un gagnant absolu dans cette course: les utilisateursque nous avons une IA qui est meilleure et moins chère chaque jour qui passe.

Image | Joshua Hoehne | Alejandro Luengo

Dans Simseo | Deepseek a créé une autre fortune de Milmillonaria: Liang Wenfeng est devenu populaire mais sa richesse est toujours un mystère