Huawei déploie sa pile IA complète à Paris : stockage, agents, et l'ambition de faire oublier Nvidia

Sujet: Huawei déploie sa pile IA complète à Paris : stockage, agents, et l'ambition de faire oublier Nvidia
Date: 1 juin 2026

Au forum ID 2026 à Paris, Huawei a présenté une plateforme IA intégrée sur cinq couches, du lac de données au framework d'agents, construite entièrement sur ses propres puces et logiciels. Le groupe chinois, deuxième fournisseur mondial de stockage, n'a jamais prononcé le mot « AI factory » — mais c'est exactement ce qu'il a décrit. Pour les DSI européens déjà engagés avec OceanStor ou qui cherchent une alternative aux écosystèmes américains verrouillés sur Nvidia, l'annonce pose une question concrète : cette pile tient-elle la route en production, ou reste-t-elle une démonstration d'ingénierie souveraine ?

Paris, mardi 27 mai. Le Palais des Congrès accueille le forum Huawei ID 2026. Yuan Yuan, vice-président et président de la ligne produit Data Storage de Huawei, ouvre la séquence stockage avec une formule que le groupe utilise depuis au moins un an : « The next chapter of AI is data. » La salle, majoritairement composée d'intégrateurs européens et de quelques DSI grands comptes, écoute poliment. Ce qui suit est nettement plus dense que la phrase d'accroche.

Huawei a déroulé une architecture à cinq couches. En bas, le lac de données OceanStor Pacific en full-flash, capable d'embarquer 11 Po dans un châssis 2U — un ratio densité/capacité qui place le produit dans la même conversation que les annonces récentes de Pure Storage ou Vast Data, sans que Huawei ne les cite. Au-dessus, une couche « AI Data Platform » avec ingestion multi-modale (DME Omni-Dataverse), du stockage tiédi sur Dorado, du stockage chaud sur un nouveau système A800, un cache unifié (UCM), et un étage agent/modèle avec le framework Nexent. Le tout protégé par OceanProtect et OceanCyber.

En clair : Huawei ne présente pas un produit. Il présente un système complet qui va du SSD de 122 To fabriqué en interne jusqu'à l'orchestration d'agents IA conversationnels multi-sessions, en passant par le KV Cache, le RAG pipeline et le partitionnement de GPU. Dell et HPE ont fait des annonces similaires en termes de périmètre au cours des douze derniers mois. Mais ni Dell ni HPE ne fabriquent leurs propres GPU.

Ascend, Atlas, et l'absence de Nvidia

Le sujet central de cette annonce n'est jamais abordé frontalement par Huawei, mais il structure tout : le groupe ne peut pas utiliser de GPU Nvidia, AMD ou Intel. Les restrictions américaines à l'export, renforcées à plusieurs reprises depuis 2022, ont fermé l'accès aux accélérateurs les plus performants du marché. Huawei a donc construit sa propre chaîne : processeurs Ascend, serveurs Atlas SuperPod, et désormais toute la couche logicielle qui va avec.

Le résultat est une pile verticalement intégrée comme peu d'acteurs peuvent en proposer. Nvidia le fait côté calcul avec DGX et ses partenaires OEM. Huawei le fait côté stockage et données, avec ses propres puces de calcul en complément. La mention d'une compatibilité avec un « third-party GPU SuperPod » dans la documentation du KV Cache est la seule ouverture vers un monde non-Huawei. Elle n'a pas été commentée sur scène.

Le framework Nexent, présenté comme un « agent foundry », promet de générer des agents IA directement via langage naturel et de réduire le temps de déploiement de 80 %. Le chiffre est celui de Huawei, non vérifié en conditions client. Aucun nom de client n'a été avancé pour illustrer cette réduction.

11 Po en 2U

Les SSD de format « palm-sized » en 61,44 et 122 To sont l'argument matériel le plus tangible. Huawei les fabrique en interne — ce qui, dans un marché où Samsung, Kioxia et Solidigm dominent la NAND, pose la question de la supply chain et du coût unitaire. Mais la densité obtenue — 11 Po dans un châssis 2U sur les Pacific 9926 et 9928 — est un chiffre que peu de concurrents occidentaux peuvent aligner aujourd'hui avec du stockage full-flash à cette échelle.

Le OceanStor A800 est le nouveau venu. C'est un système distribué fichier/objet dédié aux workloads IA : entraînement, inférence, checkpoints, petits fichiers en masse. Il intègre des DPU et une fonctionnalité « GPU Direct-like » — la formulation prudente évite de revendiquer une compatibilité GPUDirect RDMA de Nvidia, tout en signalant que le chemin de données est pensé pour alimenter des clusters GPU sans goulot d'étranglement.

Le Data Engine Node, lui, est un module séparé qui se greffe sur les baies Dorado existantes pour y ajouter vectorisation, pipelines RAG, bases de connaissances et structures mémoire. C'est la pièce qui permet à Huawei de dire à ses 30 000 clients OceanStor existants : votre infrastructure actuelle peut devenir IA-ready sans remplacement complet. Le discours est séduisant. Sa validation en production reste à documenter.

CMS : Context Memory System

L'architecture CMS — Context Memory System — est probablement la partie la plus ambitieuse de l'annonce. Elle combine trois composants : une base de connaissances vectorielle (« plus de 95 % de précision de retrieval » selon Huawei, sur des dizaines de milliards de vecteurs à mille dimensions), un KV Cache à l'échelle du pétaoctet, et une Memory Bank qui offre aux agents IA une mémoire persistante multi-sessions avec capacité d'auto-amélioration itérative.

Huawei compare explicitement son KV Cache au « tier G3.5 » de la terminologie Nvidia CMS. C'est la première fois qu'un concurrent de Nvidia adopte volontairement la nomenclature Nvidia pour positionner son propre produit. Cela peut se lire comme un aveu de dépendance conceptuelle, ou comme une stratégie de lisibilité pour des clients qui pensent déjà en termes Nvidia.

30 000 clients, zéro témoignage

Yuan Yuan a rappelé que Huawei compte plus de 30 000 clients OceanStor dans le monde. Le chiffre est récurrent dans les présentations du groupe depuis deux ans. Ce qui manque, et qui manquait déjà lors des annonces de l'an dernier, ce sont des retours d'expérience nommés sur les briques IA. Pas un seul client n'a été cité pour le Data Engine Node, le CMS ou Nexent. Dans un marché où les preuves de concept IA se multiplient mais où les mises en production restent rares, l'absence de témoignage pèse.

Le partitionnement xPU à ratio 1:10 — une puce découpée virtuellement pour servir dix usages simultanés — est techniquement intéressant. Nvidia propose du MIG (Multi-Instance GPU) depuis la génération A100, avec des ratios plus modestes. Huawei revendique un ratio supérieur. La comparaison directe est impossible sans connaître les performances par partition, que Huawei ne publie pas.

Le choix de Paris pour cette annonce n'est pas anodin géographiquement. La France est le deuxième marché européen de Huawei Enterprise, et le contexte réglementaire y est moins hostile qu'au Royaume-Uni ou en Allemagne sur les équipements réseau. Le stockage, lui, n'est soumis à aucune restriction en Europe à ce jour.

Reste la question que chaque DSI européen évaluant cette pile se posera en privé : quelle est la pérennité d'un engagement technologique avec un fournisseur dont l'accès aux composants de pointe dépend de décisions géopolitiques prises à Washington ? Huawei fabrique ses propres puces, ses propres SSD, son propre logiciel. C'est une force en termes d'intégration. C'est aussi un risque de dépendance inversée — non plus envers un fournisseur américain, mais envers un fournisseur chinois dont la roadmap technologique est contrainte par des facteurs extérieurs à son marché.

Yuan Yuan, en clôture : « AI is unlocking new opportunities for the IT industry. » Il n'a pas précisé lesquelles étaient déjà verrouillées.

TL;DR

Huawei a présenté à Paris une pile IA complète du SSD au framework d'agents, entièrement construite sur ses propres puces et logiciels — une réponse directe aux AI factories de Nvidia, Dell et HPE, mais sans aucun témoignage client en production.

• Architecture cinq couches intégrant stockage full-flash (11 Po/2U), ingestion multi-modale, cache unifié avec KV Cache pétaoctet, et un Context Memory System (CMS) pour agents IA persistants.

• Le framework Nexent promet de générer des agents via langage naturel et de réduire le temps de déploiement de 80 % — un chiffre Huawei, sans validation client publiée.

• Pour les DSI européens, l'offre pose un arbitrage inédit : intégration verticale maximale et indépendance vis-à-vis de Nvidia, contre un risque de dépendance envers un fournisseur dont la roadmap est contrainte par les restrictions géopolitiques américaines.

Questions fréquentes

Que contient exactement la plateforme IA annoncée par Huawei ?

Une architecture à cinq couches allant du lac de données OceanStor Pacific (stockage full-flash scale-out) jusqu'au framework d'agents Nexent, en passant par l'ingestion multi-modale Omni-Dataverse, le stockage chaud A800, un cache unifié avec KV Cache et Memory Bank, et les accélérateurs Ascend/Atlas. Le tout est complété par la protection OceanProtect et la sécurité OceanCyber.

Les clients OceanStor existants peuvent-ils adopter ces briques IA sans remplacer leur infrastructure ?

C'est la promesse du Data Engine Node, un module qui se greffe sur les baies Dorado existantes pour ajouter vectorisation et pipelines RAG. Mais aucun retour d'expérience client n'a été présenté pour valider cette migration incrémentale en conditions réelles.

Quel risque représente le choix d'une pile Huawei pour un déploiement IA en Europe ?

L'intégration verticale (puces, SSD, logiciels propriétaires) garantit une indépendance vis-à-vis de Nvidia et des fournisseurs américains. En contrepartie, la roadmap technologique de Huawei reste tributaire des restrictions d'export décidées à Washington, et l'interopérabilité avec des écosystèmes tiers n'est que marginalement documentée.

Article rédigé par Hamadi Lanouar