costo token

Coût des jetons AI: Parce que l'intelligence artificielle est plus chère

Pendant une certaine période de temps, on pensait que l'intelligence artificielle devrait devenir de moins en moins chère, telle qu'elle s'est développée; bon marché au point d'être « bon marché à mesurer ». La topique démontre le contraire. Les développeurs et les petites entreprises qui achètent du «gros» des géants du secteur, pour alimenter les applications et les services, sont désormais plus élevés que prévu.

Plus de « pensée », plus de coûts

Le paradoxe est né du fait que, bien que le prix unitaire du jeton baisse, les nouveaux modèles consomment de plus en plus de jetons pour effectuer des tâches complexes. Les fonctions de recherche approfondie, d'agents en plusieurs étapes et d'aide au codage nécessitent des chaînes de raisonnement traitées, des requêtes, une collecte d'informations, une collecte d'informations sur le Web et même un mini-programme interne. Tout cela, avant de retourner une réponse peut-être une seule phrase.

Numéros de consommation

La différence est claire:

  • Chatbot de base: jeton 50-500
  • Résumé court: 200 à 6 000 jetons
  • Assistance au codage simple: 500-2.000 jeton
  • Écriture de code complexe: 20 000-100 000 + jeton
  • Analyse juridique: 75.000-250.000 + jeton
  • Flux de travail multi-agents: 100 000 jusqu'à plus d'un million de jetons

Plus de «renseignement» signifie plus de consommation, et donc plus de dépenses d'infrastructure.

Marge de chute pour les entreprises

Selon la notion, une société informatique, il y a deux ans, les marges de l'entreprise étaient d'environ 90%, conformément au logiciel cloud traditionnel. Aujourd'hui, environ 10 points de pourcentage sont érodés par les dépenses. Pour les startups de « vibecoding« Comment Curseur ou Répliquequi fournissent des outils de programmation assistée, la question est encore plus critique: certains utilisateurs se retrouvent à consommer en quelques jours de crédits qui auraient dû être suffisants pendant un mois entier.

Replit a introduit un modèle de « prix basés sur l'effort », ce qui fait payer les demandes les plus complexes. Les manifestations ne manquaient pas, mais la société prétend avoir vu des ralentissements significatifs dans les revenus.

Le défi de la durabilité

Selon Martin Casado, partenaire d'Andreessen Horowitz, la course de l'IA ne pourra pas éviter la consolidation. Certaines startups recherchent des marges immédiates, d'autres visent uniquement la distribution rapide, brûlant des capitaux pour conquérir les utilisateurs. En attendant, des géants tels que Google, Meta, Openai et Anthropic peuvent se permettre de dépenser plus de 100 milliards de dollars par an en infrastructure, grâce aux revenus d'autres activités ou à des investissements substantiels.

« Au stupide » comme une solution

Le PDG de T3 Chat, Theo Browne, suggère une manière alternative: pousser les consommateurs vers des modèles moins chers et moins puissants, qui nécessitent moins de ressources. OpenI, par exemple, propose des versions légères telles que GPT-5 Nano à environ 0,10 $ par million de jetons, tandis que GPT-5 « Complete » atteint 3,44 dollars. Une énorme différence qui pourrait repenser le marché.

Le coût du jeton: une concurrence risquée

La question est cruciale: si les grands acteurs peuvent se permettre d'offrir des outils avancés même gratuitement – comment Google a fait en juin avec son outil de codage – combien de temps il pourra conserver le boom de l'IA, si les Giants finissent par cannibaliser leurs clients?