GPU en Chine : les fabricants locaux revendiquent 41 % du marché des accélérateurs IA

Sujet: GPU en Chine : les fabricants locaux revendiquent 41 % du marché des accélérateurs IA
Date: 2 avril 2026

Selon des données IDC relayées par Reuters, les fabricants chinois de puces IA auraient capté environ 41 % du marché local des serveurs accélérateurs en 2025, sur un volume total d'environ quatre millions de cartes livrées. Un chiffre qui repositionne Nvidia, longtemps hégémonique, dans un paysage où les restrictions américaines à l'export ont mécaniquement ouvert l'espace aux alternatives domestiques.

Le chiffre circule depuis quelques jours et il a le mérite de la netteté : 41 %. C'est la part de marché que les fabricants chinois de GPU et de puces d'accélération IA auraient atteinte en Chine en 2025, selon des données compilées par IDC. Le périmètre couvre les serveurs équipés de cartes accélératrices, un segment sur lequel Nvidia régnait encore sans véritable contestation il y a dix-huit mois.

Le volume total livré en Chine - Nvidia, AMD et fabricants locaux confondus - s'établirait autour de quatre millions de cartes. IDC ne ventile pas publiquement le détail par fabricant chinois. On sait que Huawei (via sa filiale HiSilicon et la gamme Ascend), Cambricon, Biren Technology et quelques autres se partagent ce segment. Mais les proportions exactes entre eux restent opaques.

Ascend 910C

Huawei est le nom qui revient le plus souvent. Son accélérateur Ascend 910C, présenté comme une réponse au H100, a été adopté par plusieurs géants du cloud chinois : Baidu, Alibaba Cloud, China Telecom. La montée en volume est réelle. Les retours terrain, eux, sont plus nuancés. Plusieurs développeurs IA basés à Pékin et Shenzhen ont rapporté des problèmes de compatibilité logicielle avec les frameworks d'entraînement standards, et un écosystème CANN (l'équivalent maison de CUDA) encore immature. Huawei recrute activement des ingénieurs compilateurs à Hangzhou pour combler ce retard.

Le chiffre de 41 % mérite d'être lu avec son contexte réglementaire. Les restrictions américaines sur l'export de puces avancées vers la Chine, durcies en octobre 2023 puis à nouveau début 2025, ont rendu les H100 et H200 de Nvidia pratiquement inaccessibles par les voies officielles. Nvidia a conçu des versions bridées - le H20 notamment - pour contourner les seuils d'interconnexion fixés par le Bureau of Industry and Security. Mais en mai 2025, l'administration américaine a encore resserré les conditions de licence sur le H20, rendant son approvisionnement incertain pour les acheteurs chinois.

Dit autrement : une partie significative de ces 41 % n'est pas un gain de compétitivité technologique. C'est un gain de disponibilité. Les hyperscalers chinois achètent ce qui est livrable.

Ce que 59 % veut encore dire

Nvidia conserve, même dans ce scénario, une position majoritaire sur un marché où elle opère sous contrainte maximale. Jensen Huang répétait encore en mars, lors du GTC, que la Chine restait un marché stratégique et que Nvidia entendait servir ses clients chinois dans le cadre légal en vigueur. La société a réalisé environ 13 % de son chiffre d'affaires data center en Chine sur l'exercice fiscal 2025, contre plus de 20 % deux ans plus tôt.

AMD, de son côté, reste marginal en Chine sur le segment accélérateur. Les MI300X trouvent des acheteurs, mais AMD n'a jamais eu l'empreinte logicielle ni le réseau de distribution de Nvidia sur ce marché. La somme Nvidia + AMD représente donc l'essentiel des 59 % restants, avec Nvidia en position ultra-dominante dans ce sous-ensemble.

Ces estimations sont reconstituées à partir des données IDC et des déclarations publiques. Aucun des fabricants concernés n'a confirmé de volumes unitaires.

Inférence, pas entraînement

Un point absent du chiffre brut : la répartition par usage. La majorité des puces chinoises déployées servent aujourd'hui des charges d'inférence, pas d'entraînement de modèles fondamentaux. L'entraînement de LLM à grande échelle reste, pour l'instant, très dépendant de clusters Nvidia, y compris en Chine - souvent constitués de stocks de A100 acquis avant les restrictions, ou de H100 importés via des canaux indirects dont l'ampleur est difficile à quantifier.

Le cas DeepSeek est parlant. L'entreprise de Hangzhou, qui a publié ses modèles V3 et R1, a été explicite sur son recours à des clusters Nvidia pour l'entraînement. Elle a mentionné 2 048 H800 dans sa documentation technique. L'Ascend 910C n'apparaît nulle part dans ses pipelines d'entraînement publiés.

Le marché de l'inférence est en volume beaucoup plus large que celui de l'entraînement. En captant les déploiements d'inférence - chatbots, recommandation, modération de contenu, véhicules autonomes - les fabricants chinois grossissent mécaniquement leur part unitaire. Mais le prix moyen par carte et la marge associée ne sont pas comparables à ceux d'un H100.

Quatre millions

Le volume total de quatre millions de cartes accélératrices livrées en Chine en 2025 est, en soi, un chiffre à interroger. Il place la Chine comme le deuxième marché mondial derrière les États-Unis pour les déploiements d'accélérateurs IA. En 2023, IDC estimait le volume chinois à environ 1,5 million d'unités. Si le chiffre 2025 est fiable, cela représente une croissance de plus de 160 % en deux ans, malgré les sanctions.

Deux explications coexistent. La première est une demande réelle, tirée par les déploiements IA dans les télécoms, la vidéosurveillance, le e-commerce et les véhicules intelligents. La seconde est un effet de stockage stratégique : des entreprises chinoises achètent en avance, parfois au-delà de leurs besoins immédiats, par crainte d'un durcissement supplémentaire des restrictions.

Un responsable achats d'un intégrateur basé à Shenzhen le résumait récemment de façon directe :

« On achète d'abord, on déploie ensuite. Personne ne sait ce qui sera disponible dans six mois. »

CUDA reste le verrou

Le débat sur la part de marché occulte un facteur structurant. L'écosystème logiciel de Nvidia - CUDA, les bibliothèques cuDNN, TensorRT, Triton Inference Server - constitue un avantage qui ne se mesure pas en unités livrées. La quasi-totalité des frameworks d'entraînement majeurs (PyTorch, JAX) sont optimisés nativement pour CUDA. Les alternatives chinoises (CANN chez Huawei, le SDK Cambricon) imposent des coûts de portage non négligeables.

Huawei pousse une stratégie d'intégration verticale - hardware, framework MindSpore, couche d'orchestration - qui rappelle la logique Apple. Mais MindSpore n'a pas atteint la masse critique d'adoption chez les chercheurs IA chinois. Beaucoup continuent à développer sous PyTorch puis à convertir, quand c'est possible, pour l'inférence sur Ascend.

Si la part de marché hardware passe à 50 ou 60 % pour les fabricants chinois dans les deux prochaines années - hypothèse plausible si les restrictions se maintiennent - la question de savoir si l'écosystème logiciel suit sera plus déterminante que le nombre de cartes livrées.

Jensen Huang le sait. Il l'a dit, d'ailleurs, avec sa franchise calibrée habituelle, lors d'un entretien en avril :

« Le hardware se remplace. L'écosystème développeur, non. »

TL;DR

Les fabricants chinois de puces IA auraient capté 41 % du marché local des accélérateurs en 2025, sur un total de quatre millions de cartes — un bond porté davantage par les restrictions export américaines que par un rattrapage technologique pur.

Huawei (Ascend 910C), Cambricon et Biren se partagent ces 41 %, principalement sur des charges d'inférence, pas d'entraînement de grands modèles.
Nvidia conserve environ 50-55 % du marché chinois malgré les sanctions, grâce au H20 et à des stocks antérieurs, mais sa part recule d'année en année.
Le verrouillage logiciel (CUDA, PyTorch) reste l'avantage structurel de Nvidia : les alternatives chinoises imposent des coûts de portage significatifs que la part de marché hardware seule ne reflète pas.

Questions fréquentes

Que couvre exactement le chiffre de 41 %?

Il s'agit de la part des fabricants chinois (Huawei, Cambricon, Biren et autres) dans les livraisons de cartes accélératrices IA en Chine en 2025, selon IDC. Le périmètre est celui des serveurs d'accélération IA, pas l'ensemble du marché GPU (gaming, visualisation, etc.).

Est-ce que les puces chinoises rivalisent techniquement avec le H100 de Nvidia?

Pas encore pour l'entraînement de très grands modèles. L'Ascend 910C de Huawei se rapproche du H100 en performances brutes annoncées, mais l'écosystème logiciel (CANN vs CUDA) et la maturité des outils de développement restent en retrait. La majeure partie des déploiements chinois concerne l'inférence, moins exigeante en termes d'infrastructure logicielle.

Quel impact pour les entreprises occidentales qui opèrent en Chine?

Les multinationales avec des déploiements IA en Chine doivent anticiper une fragmentation croissante de la stack matérielle. Celles qui dépendent de Nvidia pour leurs opérations locales font face à un risque d'approvisionnement réel, tandis que migrer vers des puces chinoises implique un coût de portage logiciel et une dépendance à des écosystèmes moins documentés.

Article rédigé par Hamadi Lanouar