La fin de l'ère des subventions IA - Vers une économie de la rareté des tokens

Acte I — Le tournant de 2026 : du « siège » au token
Il y a un moment, dans la vie d'une industrie subventionnée, où la musique s'arrête. Pour l'intelligence artificielle générative, ce moment porte une date : le premier semestre 2026. Entre l'automne 2025 et le printemps 2026, le secteur a opéré ce que l'on peut appeler son deuxième grand basculement — le premier ayant été le passage du laboratoire de recherche au produit grand public en 2022-2023.
Ce nouveau tournant a un moteur : l'IA agentique. Avec des modèles comme Claude Code, la gamme Opus d'Anthropic ou GPT-5 d'OpenAI, on quitte le registre de l'assistant qui complète une phrase pour entrer dans celui de l'agent qui exécute, en autonomie, des chaînes de tâches longues de plusieurs heures. Le « vibe coding » — le prototypage rapide assisté — laisse place à une main-d'œuvre numérique qui tourne en continu.
L'unité économique de référence n'est plus le siège mensuel. C'est le token. Et un token, contrairement à un siège, ne connaît pas de plafond.
Cette mutation tue net le modèle d'abonnement par utilisateur (seat-based). Un siège facturé 200 dollars par mois est une promesse de coût stable. Un agent autonome, lui, consomme proportionnellement au travail qu'il abat — et son appétit est sans rapport avec un forfait. Le surplomb de capacité (« capabilities overhang ») — l'écart entre ce que les modèles savent faire et ce que les organisations savent en tirer — se double désormais d'un surplomb de coûts que personne n'avait provisionné.
Acte II — La rareté reprend ses droits
Pendant trois ans, les clients ont vécu dans l'ère de la subvention. Pour conquérir des parts de marché, les laboratoires proposaient des forfaits fixes — 200 à 300 dollars par mois — tout en absorbant des coûts d'inférence très supérieurs. Chaque utilisateur intensif était une perte sèche, pariée sur une baisse future du coût du calcul. Ce pari est aujourd'hui abandonné.
Le « choc du sticker »
La bascule se mesure dans la facture. Là où l'abonnement affichait ~200 $/mois, la consommation réelle d'un usage agentique soutenu sur un projet complexe peut atteindre 5 000 à 10 000 $/mois. Soit un facteur 25 à 50. Ce n'est pas une dérive : c'est la révélation du coût réel, jusqu'ici masqué par la subvention.
SIGNAL FAIBLE → SIGNAL FORT
Le « choc du sticker » n'est pas un accident de tarification. C'est la traduction comptable d'une réalité physique : la capacité mondiale de calcul est insuffisante pour soutenir une demande illimitée à prix fixe. La rareté n'est pas créée par les prix ; les prix la révèlent.
La conséquence stratégique est limpide : la bataille pour le profit se déplace du logiciel vers la maîtrise physique du calcul. Celui qui contrôle les GPU, l'électricité et les data centers contrôle la marge. Le code n'est plus le goulot d'étranglement — le silicium et le mégawatt le sont.
Acte III — Tokenmaxxing : quand l'usage devient une fin en soi
Le passage à l'économie du token a engendré, dans les organisations, des comportements que l'on peut qualifier de pathologies de transition. Le plus emblématique porte un nom : le « tokenmaxxing » — l'art de gonfler artificiellement sa consommation de tokens pour simuler une hyper-productivité.
HYPOTHÈSES DE TRAVAIL
Les cas internes ci-dessous proviennent de la version initiale de l'analyse et n'ont pas pu être confirmés par des sources publiques. Ils illustrent un mécanisme plausible plus qu'ils ne documentent des faits établis.
- Uber : le budget IA annuel aurait été intégralement consommé en quatre mois après l'adoption massive de Claude Code, conduisant la direction opérationnelle à questionner publiquement le ROI de l'IA — friction classique entre enthousiasme technique et réalité comptable.
- Amazon : suppression de tableaux de bord internes après constat de tokenmaxxing par des employés cherchant à dominer des classements de productivité.
- Meta : compétition entre ingénieurs fondée sur le volume de tokens consommés, forçant la direction à découpler consommation et performance.
- Microsoft : restrictions d'accès pour préserver les marges face à des coûts d'inférence jugés injustifiables.
Au-delà des anecdotes, la réponse structurelle est convergente : on cesse de mesurer l'adoption par le volume consommé pour la mesurer par la valeur produite par token. Salesforce, appuyé par des partenaires financiers de poids, refuse désormais de financer l'input sans preuve d'output. Nvidia martèle le même message : dans une économie de rareté, la valeur ne réside pas dans le calcul consommé mais dans la spécificité du travail généré.
On ne paie plus pour réfléchir. On paie pour avoir raison. - Doctrine implicite de la facturation à l'output
Acte IV — Le miroir : pendant que vous payez, les labs encaissent
La contrepartie exacte de l'inflation des coûts subie par les clients, c'est l'explosion des revenus des laboratoires. Le transfert de valeur est intégral : chaque dollar de surcoût opérationnel chez le client se retrouve, à peu de chose près, dans le chiffre d'affaires du fournisseur.
La trajectoire Anthropic, corrigée
La version initiale de ce document évoquait un passage « de 3 à 47 milliards de dollars d'ARR en 12 mois » et une « levée de 65 millions de dollars ». Ces chiffres méritent correction. La trajectoire réelle, reconstituée à partir des annonces de l'entreprise, est la suivante :
CORRECTIF — CE QUE DISENT VRAIMENT LES CHIFFRES
La levée n'était pas de 65 millions mais de 30 milliards de dollars (Series G, février 2026), portant la valorisation à 380 milliards post-money. Une nouvelle levée d'environ 30 milliards, sur une valorisation supérieure à 900 milliards, était en discussion au printemps 2026.
OpenAI, de son côté, tournait autour de 24 milliards de run-rate en avril 2026 — et non 30. Pour la première fois, Anthropic le dépassait sur le chiffre d'affaires annualisé, en captant ~5 % seulement de sa base d'utilisateurs grand public.
« Rentabilité » : le mot piégé
Anthropic a communiqué sur un premier trimestre profitable, présenté comme la preuve que la facturation au token, débarrassée des subventions, est une machine à cash. C'est ici qu'il faut être critique jusqu'au bout : des analystes indépendants jugent ces affirmations difficilement réconciliables. Les revenus trimestriels déclarés impliqueraient qu'une écrasante majorité du chiffre d'affaires cumulé de l'entreprise ait été réalisée sur un seul trimestre, ce qui contredit les ARR communiqués les années précédentes. Le run-rate, rappelons-le, est une extrapolation — pas un résultat audité.
Annualiser un bon mois, c'est confondre une accélération avec une vitesse de croisière.
Acte V — Infrastructure, géopolitique et survie
Si la marge se joue désormais sur le calcul physique, alors l'infrastructure devient un levier de pouvoir souverain. On assiste à une verticalisation extrême : ceux qui possédaient les modèles veulent posséder les usines à calcul, et ceux qui possèdent l'énergie veulent posséder les modèles.
Les « Neo Clouds » et le calcul comme actif stratégique
Le partenariat liant Anthropic à la puissance de calcul d'Elon Musk — via les centres de données Colossus — illustre cette alliance de circonstance : « l'ennemi de mon ennemi est mon partenaire de calcul ». Anthropic a parallèlement signé pour de la capacité avec Amazon, Google, Nvidia et Microsoft, l'essentiel ne devant arriver en ligne que fin 2026 ou en 2027. L'accès immédiat est donc le nerf de la guerre.
LE PIÈGE DU « LOW-COST »
Prudence sur les modèles présentés comme économiques. La version « Flash » bon marché de Gemini peut, selon des analyses tierces, revenir plus cher à l'usage réel : tarification au token plus agressive et consommation de tokens accrue par requête. Le prix par token affiché ne dit rien du coût par tâche accomplie — seul ce dernier compte.
Côté chinois, DeepSeek a pérennisé une baisse de prix d'environ 75 %. C'est le « Chinese playbook » classique : casser les prix pour capturer des parts de marché mondiales pendant la pénurie structurelle.
La régulation entre en scène
Le futur de l'IA se joue aussi sur le terrain politique. La sénatrice Elizabeth Warren a proposé, fin mai 2026, de taxer directement l'industrie.
CORRECTIF — CE N'EST PAS UNE « TAXE SUR LES TOKENS »
La version initiale parlait d'une proposition de « taxer les tokens ». En réalité, Warren propose une taxe d'accise sur l'énergie consommée par les data centers (au kilowattheure), couplée à un impôt sur la fortune visant les milliardaires du secteur. L'assiette est l'électricité, pas le token — ce qui confirme néanmoins la thèse : l'IA est désormais traitée comme une ressource énergétique rare, au même titre que l'énergie elle-même.
La version initiale évoquait également un « veto » de la Maison Blanche sur l'expansion d'un modèle Anthropic baptisé « Mythos », pour réserver une capacité de calcul à l'État fédéral. Cette affirmation n'a pas pu être étayée par une source publique et doit être traitée comme une hypothèse non confirmée. Elle est néanmoins cohérente avec la direction du vent : la capacité de calcul devient un enjeu de souveraineté, et l'idée d'un arbitrage entre consommation privée et besoins étatiques cesse d'être théorique.
Impératifs stratégiques
Pour les dirigeants qui doivent survivre à la fin de la subvention, quatre principes :
- Arbitrer l'output contre l'input. Cesser de mesurer l'adoption au volume de tokens. Établir des indicateurs de valeur métier par unité de calcul (value per token).
- Externaliser le déploiement. Face au surplomb de capacité, s'appuyer sur des structures dédiées et des services de conseil pour optimiser les architectures plutôt que d'absorber la complexité en interne.
- Rester agile sur le modèle. Ne pas s'enchaîner aux modèles de pointe. Tester des alternatives offrant des performances comparables à une fraction du coût pour les tâches non critiques.
- Surveiller l'efficience. Anticiper les vagues de modèles optimisés tout en gardant un œil sur les alternatives chinoises pour les charges de travail à faible criticité.
L'avantage compétitif ne résidera plus dans l'accès à l'IA, mais dans l'agilité à naviguer une économie de la rareté.
Les entreprises qui survivront à la fin de la subvention seront celles capables de transformer chaque token en un actif stratégique mesurable. Les autres découvriront, facture après facture, qu'elles n'avaient pas adopté une technologie : elles avaient souscrit une dette.