HPE réinvestit le datacenter sur-site - l'IA agentique lui en donne la justification

Sujet: HPE réinvestit le datacenter sur-site - l'IA agentique lui en donne la justification
Date: 26 juin 2026

HPE Discover Las Vegas, 15–18 juin 2026. HPE y a présenté sa thèse complète pour la décennie à venir : l'IA agentique rend le cloud public trop coûteux et trop peu gouvernable pour les workloads à forte densité de tokens. La réponse de l'entreprise s'articule autour de GreenLake Intelligence, d'une extension de Private Cloud AI avec NVIDIA, d'un nouveau serveur NVIDIA Vera CPU prévu pour l'automne 2026, et de partenariats avec ServiceNow et Citrix. Ce qui est disponible aujourd'hui, ce qui le sera en fin d'année, et ce qui n'arrivera qu'en 2027 : la distinction est rarement faite dans les communiqués. Elle est pourtant la seule qui compte pour un DSI qui doit planifier.

HPE a construit pour ses propres opérations de support client une plateforme IA on-premises sur GreenLake Intelligence et Private Cloud AI. Le résultat affiché : une réduction de coût de plus de trente fois, soit une économie de près de 100 000 dollars par mois. Ces chiffres sont issus d'une keynote. Aucune méthodologie de calcul n'a été communiquée.

L'argument de Fidelma Russo, directrice technique et présidente de la division hybrid cloud : "Nous avons arrêté d'être consommateurs d'IA pour devenir producteurs d'intelligence." Le discours est soigné. Il précède une série d'annonces produits dont les disponibilités s'échelonnent jusqu'en 2027.

Token burn

Le raisonnement central d'HPE tient en une phrase :

"Une fois que les agents ont accès en continu aux données, chaque interaction consomme un token. Cela inclut chaque décision, sa validation, et l'action qui s'ensuit. Contrairement à l'IA traditionnelle, les agents ne s'arrêtent pas après une réponse."

Une étude Cisco publiée en marge de son propre événement annuel de juin 2026 estime que les agents génèrent 450 % de trafic de plus par tâche que les outils traditionnels. Ce n'est pas un chiffre HPE. C'est la donnée que les architectes doivent mettre dans leurs modèles de coût.

La conséquence directe : les entreprises amorcent un mouvement de retour vers des datacenters on-premises, ou des environnements d'inférence hybrides, sous l'effet conjugué de la souveraineté des données, de la latence, et de la maîtrise économique des tokens.

Ce qui existe, ce qui arrive

La couche de gouvernance et d'observabilité — OpsRamp Copilot, Morpheus SDN, l'auto-remédiation Marvis — est disponible aujourd'hui. Les capacités plus avancées d'agent operating system et de sécurité sont prévues pour juillet et le quatrième trimestre 2026. Le serveur HPE ProLiant DL394 Gen12 embarquant le CPU NVIDIA Vera, le produit le plus cité en keynote, est prévu pour l'automne 2026. L'intégration complète avec Private Cloud AI, elle, est programmée pour 2027.

Le DL394 Gen12 a été annoncé à COMPUTEX début juin dans le cadre d'une collaboration avec NVIDIA et Redpanda, explorée par la New York Stock Exchange.

La mémoire, nouveau goulot d'étranglement. HPE positionne son stockage Alletra MPX 10000 comme la couche de mémoire active pour les agents. L'argument : les systèmes qui reconstruisent le contexte à chaque appel brûlent des tokens inutilement. Le KV cache élimine ce besoin, transformant le stockage en mémoire de travail persistante pour l'IA. Russo :

"En IA, la mémoire n'est plus un détail technique ou un enjeu supply chain. C'est une ressource stratégique."

Juniper à 14 milliards de dollars

Antonio Neri, PDG d'HPE, a qualifié l'acquisition de Juniper Networks — finalisée l'an dernier pour 14 milliards de dollars après une négociation de plus d'un an avec le Département de Justice américain — de "parfaitement synchronisée" avec l'ère de l'IA agentique. Le réseau comme plan de contrôle de l'inférence : c'est la thèse qu'HPE vend depuis la clôture de la transaction.

Deux nouveaux switches dérivés de Juniper ancrent la stratégie datacenter : le QFX5140, conçu pour les clusters d'inférence et l'edge AI, et le QFX5252, ciblant la plateforme rack-scale AMD Helios avec un switching bas-latence haute bande passante.

Selon une enquête Futurum Group menée au premier semestre 2026 auprès de 820 décideurs, 55 % des organisations citent la fiabilité des agents et la gestion des hallucinations comme premier obstacle à l'adoption. 43 % déclarent ne pas savoir mesurer la valeur métier de leurs déploiements IA.

HPE répond à ce problème avec GreenLake Intelligence : un registre central d'agents qui permet aux organisations de savoir non seulement quels agents elles opèrent, mais où ils se trouvent et ce qu'ils sont autorisés à faire. La gouvernance comme produit. C'est nouveau dans le discours HPE.

La question que pose Diana Damkroger, responsable HPC chez HPE, est plus directe que la keynote :

"Vous pouvez construire l'infrastructure, peut-être l'isoler en air gap. Mais qu'en est-il des agents ? Maintenant nous avons des agents qui font une partie de notre travail. On parle de classification des agents sur ces machines. La vraie question, c'est qui y a accès."

TL;DR

HPE instrumentalise la montée des coûts d'inférence agentique pour justifier un retour massif vers l'infrastructure on-premises — avec GreenLake Intelligence comme couche de gouvernance et NVIDIA comme partenaire de référence.

L'économie du token est le nouvel argument commercial de l'on-prem : les agents IA consomment jusqu'à 450 % de trafic de plus par tâche que les outils traditionnels, rendant le cloud public prohibitif à l'échelle.
L'annonce HPE Discover mélange du disponible immédiat (OpsRamp Copilot, Marvis) et du roadmap long (DL394 Gen12 en automne 2026, intégration complète Private Cloud AI en 2027) sans toujours marquer la distinction.
Le vrai sujet non résolu — que pose HPE elle-même en interne — est la gouvernance des agents : qui les autorise, qui les surveille, et comment on remonte à un état propre en cas de dérive.

Questions fréquentes

Qu'est-ce que GreenLake Intelligence apporte concrètement par rapport à une infrastructure IA cloud classique ?

Un registre centralisé des agents, une observabilité des dépenses en tokens, et une couche de politique d'accès aux modèles — le tout on-premises ou en hybride. L'avantage affiché est la gouvernance des données sensibles et la maîtrise des coûts d'inférence à grande échelle, sans dépendre de la tarification variable d'un cloud public.

Le retour à l'on-prem est-il justifié économiquement ou s'agit-il d'un positionnement marketing ?

Les chiffres HPE (réduction 30x) sont auto-déclarés et non auditables en l'état. Ce qui est documenté par des tiers, en revanche, c'est la multiplication du trafic réseau par les architectures agentiques. Pour les workloads à fort volume de tokens et données souveraines, le calcul peut pencher vers l'on-prem — mais il dépend fortement du profil de charge et des coûts de personnel infrastructure.

Quelles sont les disponibilités réelles à date pour un DSI qui veut déployer aujourd'hui ?

La couche d'observabilité et de gouvernance de base (OpsRamp Copilot, Marvis auto-remédiation, Morpheus SDN) est disponible maintenant. Les fonctionnalités Private Cloud AI avancées arrivent en juillet et Q4 2026. Le serveur DL394 Gen12 avec CPU NVIDIA Vera est prévu pour l'automne 2026. L'intégration complète Private Cloud AI avec ce serveur : 2027.

Article rédigé par Hamadi Lanouar