Cisco Gen AI cybersecurity

Gouvernance des jetons : comment gouverner les coûts, l’utilisation et la valeur de l’IA

Depuis de nombreux mois, la priorité des entreprises est simple : convaincre les gens d’utiliser l’IA. Et nous avons parlé et parlons encore de Adoption de l’IA. C’était une phase nécessaire, presque inévitable. Et peut-être pas encore conclu, en fait j’en suis sûr, je le constate tous les jours dans les entreprises lorsque je fais du conseil. Nous avons d’abord travaillé sur l’évangélisation, puis sur l’accès aux outils, puis sur la formation de base et enfin sur la recherche des premiers cas d’usage. Mais aujourd’hui, dans certains cas, une phase différente s’ouvre dans des organisations plus matures. L’enjeu n’est plus seulement l’adoption et la typologie de l’aménagement, mais la gouvernance économique des usages.

Et oui, précisément un gouvernement économique, car comme le disent certains grands rapports mondiaux, les projets échouent parce que les projets d’IA ne sont pas durables : soit ils coûtent trop cher et personne ne l’a correctement estimé, soit ils coûtent le bon montant mais ne créent pas les conditions pour de nouveaux revenus.

C’est là que les jetons entrent en jeu dans cette évaluation. Tant qu’ils restent confinés au langage des développeurs ou à l’utilisation cachée des comptes d’outils grand public, ils apparaissent comme un détail technique. Cependant, lorsque leur consommation commence à générer des postes de dépenses visibles, ou des différences significatives entre les équipes, les personnes et les processus, ils deviennent une mesure métier. Et donc une question managériale.

Du pilote à la comptabilité IA

Le passage commence comme je l’ai écrit plusieurs fois Journal de Wall Street il a déclaré que certaines entreprises surveillaient la consommation de jetons pour comprendre où la valeur est créée et où les déchets s’accumulent.

Dans Zapier, une plateforme Saas connue pour ses automatisations, une utilisation beaucoup plus élevée que la moyenne des tokens n’est pas automatiquement interprétée comme une inefficacité : elle peut indiquer une utilisation confuse des outils, mais elle peut aussi signaler une personne qui produit des résultats hors échelle.

Dans d’autres cas, comme celui rapporté par Vercel, une autre plateforme saas, une activité d’IA au coût élevé était encore justifiée par le fait qu’elle remplaçait des semaines de travail humain.

La question de l’évaluation reste cependant un point nécessaire à aborder : un coût élevé, à lui seul, ne dit rien. Évidemment, comme dans d’autres domaines, le rapport entre consommation et résultat compte. C’est le même changement que le cloud a forcé il y a des années, lorsque la conversation est passée de la simple disponibilité des ressources à une allocation efficace des ressources.

Quelque chose de similaire se produit pour l’IA, mais avec une différence importante : la ressource n’alimente pas seulement l’infrastructure, elle alimente le travail cognitif.

Les jetons ne sont pas un détail technique

Les plateformes d’IA indiquent désormais très clairement que l’utilisation est facturée par jeton, avec une logique différente entre l’entrée, la sortie, le cache et, dans certains cas, des fenêtres contextuelles plus grandes ou des outils supplémentaires. Cela signifie que derrière une invite il n’y a pas un coût abstrait, mais une microtransaction qui augmente ou diminue en fonction du modèle choisi, de la longueur du contexte, de la réponse générée et de la présence d’outils appelés lors du flux.

La conséquence organisationnelle est importante. Lorsque chaque interaction a une structure de coûts différente, il ne suffit pas de savoir combien de personnesils utilisent l’IA« . Nous devons comprendre comment ils l’utilisent, pour quelles activités, à quelle fréquence et avec quel retour. En ce sens, la Fondation FinOps observe que, pour la plupart des charges de travail d’IA, les jetons constituent l’unité de coût la plus simple à suivre et à attribuer aux différents cas d’utilisation.

Ce n’est pas un hasard si le sujet évolue rapidement dans le périmètre FinOps. Dans le rapport État du FinOps 2026la gestion des coûts de l’IA apparaît comme la compétence prioritaire à développer, et 98 % des personnes interrogées déclarent désormais gérer les dépenses en IA. C’est un signal très clair : le marché traite de moins en moins l’IA comme une exception expérimentale et de plus en plus comme une catégorie ordinaire de dépenses à encadrer.

Le paradoxe de la productivité

Et c’est un véritable nœud qui doit être résolu. Si un employé consomme cinq fois les jetons de ses collègues, que se passe-t-il dans cet espace de travail ? Travaille-t-il mal, parce qu’il ne sait pas construire des requêtes efficaces ? Ou bien effectue-t-il des tâches plus complexes, automatise-t-il certaines parties de son travail ou obtient-il des résultats que d’autres ne peuvent pas encore produire ?

Il en va de même pour les processus automatisés qui, à un moment donné et à plus grande échelle, commencent à avoir une plus grande consommation : sont-ils mieux utilisés ? Est-ce que cela dégrade quelque chose ? Ou simplement à grande échelle, cet usage, lié à des invites mal rédigées, n’avait pas été correctement vérifié ?

La tentation de s’arrêter au prix fort serait une erreur. Les jetons à eux seuls ne mesurent pas la productivité. Ils mesurent l’intensité d’utilisation d’une capacité de calcul. Pour devenir une mesure managériale, elles doivent être lues avec au moins trois autres variables : le type de travail effectué, la qualité du résultat et l’impact généré sur le processus.

Une équipe juridique, une équipe de service client et une équipe de développement logiciel peuvent avoir des structures de consommation profondément différentes, sans que cela indique automatiquement une plus ou moins grande efficacité.

C’est pourquoi la gouvernance des tokens ne peut pas être une version actualisée du contrôle de la consommation informatique. Cela doit devenir une discipline capable de relier dépenses, contexte et résultat exactement comme je le dis constamment lorsque chez Zerofive.ai nous concevons et mesurons des processus, définissons des cas d’utilisation ou soutenons l’analyse de ceux qui veulent comprendre si l’IA génère réellement de la valeur.

Sinon, vous risquez deux erreurs opposées : laisser courir les coûts invisibles jusqu’à exploser, ou compresser les usages précisément là où l’IA génère le plus grand avantage concurrentiel. Et cela pose encore un problème à l’entreprise : la non-mesure génère de l’inconscience.

Ce qu’une entreprise devrait réellement mesurer

La première mesure est le coût par tâche, et non le coût par invite. L’unité minimale utile à la gestion n’est pas l’interaction unique, mais le processus que cette interaction permet : synthèse de documents, analyse commerciale, support client, génération de code, assistance interne, rédaction de contenu, recherche.

La deuxième mesure est le coût par sortie valide. Si dix invites produisent une réponse utilisable et vingt autres ne le font pas, le problème n’est pas seulement de savoir combien d’appels ont été effectués, mais combien «coût d’apprentissage » ou « coût d’itération» le système absorbe avant d’arriver à un résultat acceptable.

La troisième mesure est le coût par décision ou le temps gagné. Dans de nombreux contextes, les avantages de l’IA ne se traduisent pas seulement par une réduction des heures de fonctionnement, mais également par une latence de décision plus faible, une réduction des erreurs, une plus grande couverture des informations ou une augmentation de la qualité du service. Ce sont des éléments moins immédiats à mesurer, mais beaucoup plus proches de la valeur réelle.

La quatrième mesure est la variance entre les personnes et les équipes. Non pas pour établir des classements punitifs, mais pour comprendre où existent des modèles reproductibles. Une utilisation très efficace peut dépendre d’un ensemble d’invites bien conçu, d’une meilleure intégration dans le flux de travail ou d’une compétence tacite que l’organisation n’a pas encore codifiée. En ce sens, la gouvernance ne consiste pas seulement à réduire les coûts : elle consiste à découvrir des pratiques à haut rendement.

Vers une IA FinOps opérationnelle

Appeler cela une gouvernance symbolique, comme je le fais depuis un certain temps, est logique pour cette raison même. Il ne s’agit pas d’un tableau de bord de contrôle, mais d’une couche opérationnelle qui rassemble les responsabilités financières, technologiques, opérationnelles et commerciales. Certains principes sont déjà assez clairs.

Le premier est l’observabilité. Dans la mesure du possible, les interactions de l’IA doivent passer par des interfaces communes, des SDK internes ou des plates-formes qui appliquent le balisage, le contexte et l’attribution de consommation à différents cas d’utilisation. La Fondation FinOps souligne que, dans les environnements décentralisés, sans normes partagées, il devient beaucoup plus difficile d’attribuer les coûts et de lire les modèles d’utilisation réels.

Le deuxième est politique. Il ne suffit pas d’offrir l’accès aux outils. Vous devez définir quels modèles utiliser pour quelles tâches, quand il est judicieux de passer à des modèles plus coûteux, quels seuils de dépenses doivent être révisés et quelles tâches doivent être structurellement automatisées plutôt que laissées à des demandes individuelles.

Le troisième est la responsabilité distribuée. La gouvernance des jetons ne peut pas être uniquement l’affaire du DSI ou des achats. Nous avons besoin d’une responsabilité partagée entre ceux qui gouvernent les budgets, ceux qui construisent l’architecture et ceux qui connaissent la valeur opérationnelle des processus. Dans de nombreuses entreprises, cette convergence pourrait pousser la naissance de figures hybrides, à mi-chemin entre les product chiefs IA, les process managers et les fonctions FinOps.

Gouverner sans ralentir

L’erreur la plus probable, dans les mois à venir, sera de considérer la gouvernance symbolique comme une discipline de confinement. Ce serait un euphémisme. Son objectif n’est pas de minimiser le nombre de tokens, mais de maximiser le rapport entre les tokens utilisés et la valeur générée.

Une requête longue, un contexte volumineux ou une sortie coûteuse ne sont pas en soi un problème. Ils peuvent le devenir s’il n’existe aucun critère pour les relier aux résultats. De même, une consommation apparemment faible peut cacher une adoption superficielle, incapable de produire un réel impact. La vraie maturité ne consiste donc pas à dépenser peu, mais à savoir pourquoi on dépense, où on dépense et ce qu’on obtient en retour.

Les entreprises qui entrent dans cette phase ont un choix clair devant elles. Ils peuvent traiter les jetons comme un détail technique à laisser aux équipes de développement, et les dépenses en IA augmenteront alors de manière opaque. Ou bien ils peuvent reconnaître que les jetons constituent la nouvelle unité minimale d’une économie cognitive d’entreprise et construire des mesures, des politiques et des modèles de responsabilité autour de cette unité.

Avec ce changement d’approche, de mesure et d’attention, l’IA cesse d’être un simple outil de productivité individuel et commence à devenir une infrastructure commerciale, capable de générer de la valeur.

Et lorsque cela se produira, gouverner les jetons ne signifiera plus faire une simple comptabilité, mais apprendre à lire, avec de plus en plus de précision, combien coûte réellement la transformation de la capacité de calcul en avantage concurrentiel.