Coûts de l'IA d'entreprise, car Microsoft et Uber signalent un réel problème

Microsoft et Uber offrent l’un des premiers signes concrets d’un problème qui est resté jusqu’à présent en arrière-plan du débat sur l’IA : une adoption à grande échelle peut entraîner une augmentation des coûts plus rapide que les avantages mesurables. Non pas parce que la technologie ne fonctionne pas, mais parce que lorsqu’elle entre dans les flux quotidiens de développement, de produits et d’exploitation, elle modifie radicalement la structure des dépenses.

Selon un récent rapport de Le bordMicrosoft a commencé à révoquer une grande partie des licences directes de Claude Code, poussant les ingénieurs vers la CLI GitHub Copilot. Le point pertinent, au-delà du choix du produit, est que le correctif intervient quelques mois après l’ouverture de l’accès interne à des milliers de salariés.

Dans le cas d’Uber, le signal est encore plus explicite : Les informationsrepris plus tard par d’autres observateurs du secteur, a rapporté que le budget 2026 destiné aux outils de codage d’IA serait largement épuisé d’ici avril.

Les coûts de l’IA d’entreprise apparaissent lorsque son utilisation devient véritablement généralisée

Depuis des mois, le discours dominant autour de l’IA d’entreprise s’est principalement concentré sur la productivité attendue. Les cas les plus récents attirent l’attention sur une autre variable : qu’arrive-t-il aux comptes lorsque l’adoption interne ne reste pas expérimentale mais devient un comportement généralisé.

Dans le cas Microsoft, le revirement sur les licences directes de Claude Code n’équivaut pas à un abandon des modèles Anthropic. Le rapport Verge signale plutôt une réorganisation vers des outils plus directement gérables au sein de l’écosystème GitHub et Copilot. Il s’agit d’un détail important, car il suggère que le problème n’est pas seulement de savoir quel modèle utiliser, mais aussi quelle interface, quels achats et quelle visibilité sur les dépenses une entreprise peut maintenir.

Uber montre la même tension d’un autre côté. L’adoption d’outils d’IA pour le codage avait été encouragée en interne, mais la croissance de leur utilisation aurait dépassé les hypothèses budgétaires. Lorsque la consommation est tarifée par token ou par appel et que les équipes commencent à intégrer l’IA en continu, la facture n’augmente pas de manière linéaire.

Pourquoi les jetons changent l’économie de l’IA d’entreprise

Le nœud des coûts de l’IA pour les entreprises est ici. Plus l’IA est intégrée aux processus, plus les interactions, les tentatives, les révisions, les appels de modèles et les chaînes de tâches augmentent. C’est cette dynamique qui rend les workflows agents très différents d’une simple expérience de chatbot.

Gartner, dans ses prévisions publiées le 25 mars 2026, estime que d’ici 2030, le coût de l’inférence pour un LLM comportant des milliers de milliards de paramètres pourrait chuter de plus de 90 % par rapport à 2025. Mais la même société d’analystes prévient que cette baisse ne se traduira pas automatiquement par une IA d’entreprise moins chère. La raison est claire : les modèles agentiques nécessitent 5 à 30 fois plus de jetons par tâche qu’un chatbot standard, et la croissance du volume peut compenser la réduction des coûts unitaires.

Goldman Sachs Research, dans une analyse publiée le 20 mai 2026, pousse le raisonnement encore plus loin : l’adoption d’agents par les entreprises et les consommateurs pourrait porter la consommation mensuelle à 120 quadrillions de tokens d’ici 2030, soit une multiplication par 24 par rapport aux niveaux initiaux considérés par le rapport. Les données intéressent non seulement les fournisseurs, mais aussi les entreprises acheteuses : si le prix par token baisse et que le nombre de tokens explose, le montant total payé peut encore augmenter.

Les workflows agents ne sont pas seulement plus puissants : ils sont beaucoup plus chers

Une indication utile provient également de la recherche universitaire. Une prépublication publiée sur arXiv en avril 2026 par Longju Bai et ses co-auteurs, consacrée à la consommation de jetons dans les tâches de codage agent, révèle que ces tâches peuvent consommer jusqu’à 1 000 fois plus de jetons que les formes plus simples de raisonnement de code et de chat de code. L’étude ajoute deux éléments qui affectent directement ceux qui doivent gérer leurs dépenses.

Le premier est la forte variabilité : les exécutions d’une même tâche peuvent différer jusqu’à 30 fois dans la consommation totale de jetons. La seconde est que plus de dépenses ne signifie pas automatiquement plus de précision. Dans de nombreux cas, observent les auteurs, les performances s’améliorent jusqu’à un seuil intermédiaire puis tendent à saturer.

C’est une mauvaise nouvelle pour les gestionnaires budgétaires, car cela rend plus difficile la prévision du coût réel d’une tâche et fragilise l’idée selon laquelle une utilisation croissante suffit pour obtenir des rendements proportionnels.

Le tableau résume les chiffres qui décrivent le mieux la pression actuelle sur les coûts de l’IA en entreprise.

Indicateur	Source	Données clés	Implication
Réduction attendue du coût de l’inférence d’ici 2030	Gartner, mars 2026	Plus de -90% vs 2025	Le coût unitaire baisse, mais ne suffit pas à garantir des économies finales
Jetons requis par les modèles agents par rapport aux chatbots standards	Gartner, mars 2026	5 à 30x par tâche	Les flux avancés multiplient la consommation
Croissance attendue de la consommation mensuelle de jetons d’ici 2030	Recherche Goldman Sachs, mai 2026	24x jusqu’à 120 quadrillions par mois	L’échelle d’utilisation peut augmenter les dépenses globales
Consommation de jetons dans les tâches de codage agent	Bai et al., arXiv, avril 2026	Jusqu’à 1 000 x par rapport au chat/raisonnement codé	Les cas d’usage les plus autonomes sont les plus coûteux à prendre en charge

Des cas limites à un nouvel agenda pour les DSI et CFO

Les cas Microsoft et Uber ne prouvent pas à eux seuls que l’IA coûte plus cher que le travail humain dans tous les contextes. Cependant, ils démontrent quelque chose de plus utile pour les entreprises : les modèles économiques d’adoption sont encore instables. Lorsqu’une organisation stimule l’utilisation avec des classements internes, des objectifs de consommation ou des incitations implicites, elle risque d’optimiser sur la mauvaise mesure.

La phrase la plus claire sur ce point est venue de Bryan Catanzaro, vice-président de l’apprentissage profond appliqué chez Nvidia, qui dans une interview avec Axios il explique que, dans son équipe, le coût de l’ordinateur dépasse largement celui des employés. Ce n’est pas une mesure universelle, mais c’est une déclaration importante car elle émane de l’un des acteurs clés de l’infrastructure mondiale de l’IA.

Pendant ce temps, le marché continue de promettre une croissance massive du nombre d’agents. Jensen Huang, PDG de Nvidia, avait émis l’hypothèse en mars 2026 d’un avenir dans lequel chaque employé travaillerait aux côtés de 100 agents IA. La vision est cohérente avec la trajectoire du secteur, mais elle ouvre une question très concrète pour ceux qui achètent de la technologie : combien cela coûtera réellement de gouverner à cette échelle, avec quelles marges et avec quelle discipline opérationnelle.

Le véritable test des coûts de l’IA en entreprise est la mesurabilité du retour

La prochaine phase de l’IA d’entreprise ne sera probablement pas définie par l’enthousiasme pour l’adoption, mais par la capacité à relier les dépenses, l’utilisation et les résultats. Les entreprises qui continueront à investir efficacement seront celles capables d’introduire des métriques plus matures : coût par workflow réalisé, coût par ticket résolu, temps réellement gagné, qualité du code, réduction des retouches, impact sur les marges ou les revenus.

Tant que l’IA sera poussée avant tout en termes de volume d’usage, le risque sera de continuer à confondre expérimentation généralisée et productivité démontrée. Et ici, les cas apparus ces dernières semaines cessent d’être de simples curiosités au sein de la grande technologie : ils deviennent un avertissement pour l’ensemble du marché des entreprises.

Sources