← AI War Room
Cybersécurité

Vos fournisseurs nourrissent des modèles d'IA avec vos données. Vous n'avez rien signé.

Tech4B2B · · 4 min (mis à jour le )
Illustration : Vos fournisseurs nourrissent des modèles d'IA avec vos données. Vous n'avez rien signé.
  • Sujet: Vos fournisseurs nourrissent des modèles d'IA avec vos données. Vous n'avez rien signé.
  • Date:
DataGrail, spécialiste américain de la gestion de la vie privée, a publié fin mai 2026 un rapport documentant un phénomène que beaucoup de DPO soupçonnaient sans pouvoir le chiffrer : une part croissante des sous-traitants SaaS redirige des données clients vers des modèles d'intelligence artificielle tiers, sans que ces flux figurent dans les accords de traitement existants.Le problème n'est pas théorique. Il touche directement la conformité RGPD, les clauses contractuelles de sous-traitance ultérieure, et la cartographie des traitements que chaque responsable de traitement est censé maîtriser.

Les chiffres avancés par DataGrail portent sur l'analyse de plus de 2 000 connexions SaaS dans les environnements de ses clients, majoritairement des entreprises nord-américaines de taille intermédiaire à grande. Résultat : 17,3 % des applications SaaS auditées envoient désormais des données utilisateurs vers des services de modèles de langage ou d'IA générative - OpenAI, Anthropic, Google, mais aussi des acteurs moins identifiés. Dans 67 % des cas, ces transferts n'étaient couverts par aucun avenant contractuel ni aucune mention dans le registre des traitements du client.

Le rapport ne précise pas combien de ces flux impliquent un entraînement effectif des modèles - par opposition à un simple appel d'inférence - et c'est une distinction qui compte. Un fournisseur CRM qui passe vos tickets de support dans GPT-4o pour en extraire un résumé ne pose pas le même problème qu'un outil RH qui injecte des évaluations de performance dans un fine-tuning. DataGrail met les deux dans le même panier.

Le sous-traitant du sous-traitant

En droit européen, la mécanique est connue : l'article 28 du RGPD impose au sous-traitant de ne pas recruter un autre sous-traitant sans autorisation écrite préalable du responsable de traitement. Quand un éditeur SaaS intègre un appel API vers un LLM externe, il crée de facto une sous-traitance ultérieure. La plupart des DPA signés avant 2023 ne mentionnent pas ce cas de figure. Et ceux signés depuis le mentionnent rarement avec la granularité nécessaire - nom du fournisseur d'IA, localisation des serveurs d'inférence, politique de rétention des prompts.

Max Schrems, via noyb, a déposé en juin 2024 une plainte contre OpenAI portant précisément sur l'impossibilité de savoir quelles données alimentent les modèles et sur l'absence de base légale claire pour le traitement. Onze mois plus tard, la plainte suit son cours devant l'autorité autrichienne. L'instruction n'a pas encore produit de décision. Mais la question posée par noyb - comment exercer un droit de rectification ou de suppression sur des données absorbées dans un modèle - reste sans réponse opérationnelle.

Les fournisseurs SaaS, eux, avancent vite. Salesforce a ajouté des capacités Einstein GPT reliées à OpenAI dès mars 2023. Atlassian a intégré Rovo, son assistant IA, courant 2024. Notion, Slack, Zoom - la liste des outils d'entreprise qui appellent un LLM en arrière-plan s'allonge chaque trimestre. Les release notes le mentionnent. Les DPA, pas toujours.

Shadow AI

Le terme circule depuis fin 2023 dans les cercles RSSI. Il désigne l'utilisation non sanctionnée de services d'IA par les collaborateurs - un ChatGPT dans le navigateur, un Copilot activé sans validation IT. Le rapport DataGrail déplace le problème : la shadow AI ne vient pas seulement des utilisateurs. Elle vient des fournisseurs eux-mêmes, embarquée dans des produits déjà approuvés par l'IT.

C'est un angle mort particulièrement inconfortable pour les RSSI. Un outil approuvé après un audit fournisseur en 2022 peut, deux ans plus tard, faire transiter des données vers une infrastructure tierce sans qu'aucun signal ne remonte dans le SIEM ou le CASB. Les appels API sortants vers api.openai.com ou api.anthropic.com depuis un serveur applicatif SaaS ne passent pas par le réseau de l'entreprise cliente. Ils sont invisibles côté client, sauf à auditer le fournisseur - ce que peu de contrats prévoient avec une fréquence suffisante.

Gartner estimait en février 2025 que 40 % des applications SaaS d'entreprise intègreraient une forme d'IA générative d'ici fin 2025, contre 15 % fin 2023. Le cabinet ajoutait, dans une note plus discrète, que moins de 10 % des entreprises avaient mis à jour leurs processus de gestion des tiers pour couvrir spécifiquement les flux vers les fournisseurs d'IA.

Ce que le DPA ne couvre plus

La CNIL a publié en avril 2025 ses recommandations finales sur l'IA et les données personnelles. Le document de 32 pages consacre une section aux chaînes de sous-traitance impliquant des modèles d'IA. Le régulateur y rappelle que la responsabilité du responsable de traitement ne disparaît pas parce qu'un flux est initié par un sous-traitant. Il recommande - sans l'imposer - l'inclusion dans les DPA de clauses spécifiques couvrant les finalités d'entraînement de modèles, les garanties d'effacement, et l'identification nominative des fournisseurs d'IA sollicités.

Recommandation, pas obligation. La nuance a son importance. Dans la pratique, renégocier un DPA avec un éditeur SaaS américain de premier plan pour y ajouter une clause sur les sous-traitants IA relève souvent de la fiction contractuelle. Les grands éditeurs proposent des DPA standardisés, non négociables, avec une liste de sous-traitants mise à jour par notification et non par consentement préalable.

Un DPO d'un groupe industriel français du CAC 40 résumait la situation en avril lors des Assises de la Protection des Données :

« On nous demande de cartographier tous les flux IA de nos sous-traitants. On a 1 200 applications SaaS référencées. Les équipes achats n'ont pas les compétences, les équipes juridiques n'ont pas la bande passante, et les éditeurs ne répondent pas à nos questionnaires. »

La salle n'a pas ri.

Que faire lundi matin

Les organisations qui prennent le sujet au sérieux procèdent en général par trois chantiers parallèles, sans attendre une directive réglementaire supplémentaire.

Premier chantier : l'inventaire. Identifier, dans le parc applicatif SaaS existant, quels outils ont ajouté des fonctionnalités IA depuis la dernière revue fournisseur. Les release notes, les pages de statut produit et les mises à jour de DPA sont les trois sources. DataGrail, OneTrust, Transcend et quelques autres proposent des outils de détection automatisée, mais leur couverture reste partielle et leur coût non négligeable - entre 50 000 et 200 000 euros par an selon le périmètre.

Deuxième chantier : la clause contractuelle. Pas un avenant générique « IA ». Une clause qui exige du fournisseur SaaS la déclaration préalable de tout recours à un modèle d'IA tiers pour traiter les données du client, avec identification du fournisseur, localisation du traitement, finalité, et politique de rétention des prompts et réponses. Les juristes spécialisés estiment qu'une telle clause est aujourd'hui acceptée par environ un tiers des éditeurs SaaS de taille moyenne. Les hyperscalers ne bougent pas.

Troisième chantier : la gouvernance interne. Le RSSI et le DPO doivent définir ensemble une politique sur l'IA intégrée aux outils existants, distincte de la politique sur l'IA utilisée directement par les collaborateurs. La première est un sujet de gestion des tiers. La seconde est un sujet d'usage. Les confondre, c'est traiter un problème d'architecture comme un problème de sensibilisation.

Microsoft, sur ce point, a pris une position intéressante avec ses « data processing boundaries » pour Copilot dans Microsoft 365 : les données restent dans le tenant du client, les prompts ne sont pas utilisés pour entraîner les modèles fondation, et les logs de prompts sont accessibles via l'audit unifié. C'est documenté depuis novembre 2023. Mais cette architecture n'est pas celle de la majorité des éditeurs SaaS qui intègrent de l'IA. Et Microsoft facture Copilot 30 dollars par utilisateur et par mois, ce qui lui donne les moyens de construire cette isolation. Un éditeur SaaS vertical à 15 dollars par siège n'a pas la même marge de manoeuvre pour héberger une couche d'inférence dédiée.

67 %

C'est le chiffre qui reste du rapport DataGrail : deux tiers des flux vers des modèles IA ne sont couverts par aucun cadre contractuel. Le rapport a été produit par un vendeur de solutions de privacy, ce qui mérite d'être gardé en tête. La méthodologie ne distingue pas les flux d'inférence des flux d'entraînement. Le périmètre est principalement nord-américain.

Mais le phénomène sous-jacent est réel, documenté par d'autres sources, et en accélération. L'AI Act européen, entré en application progressive depuis février 2025, ne traite pas directement de cette chaîne de sous-traitance - il se concentre sur les fournisseurs et déployeurs de systèmes d'IA, pas sur les intermédiaires SaaS qui les appellent en arrière-plan. Un angle mort réglementaire de plus.

Le registre des traitements que votre DPO a mis à jour en janvier est probablement déjà obsolète.

TL;DR

Vos outils SaaS approuvés envoient des données vers des modèles d'IA tiers sans que vos DPA ne le couvrent — un rapport DataGrail chiffre l'ampleur du phénomène.

  • 17 % des applications SaaS auditées transfèrent des données vers des LLM externes ; dans 67 % des cas, aucun cadre contractuel ne couvre ces flux.
  • La sous-traitance IA cachée crée un angle mort pour le RGPD (article 28), les transferts hors UE et le droit à l'effacement — la CNIL recommande des clauses spécifiques mais ne les impose pas.
  • Les RSSI et DPO doivent lancer en urgence un inventaire des fonctionnalités IA ajoutées par leurs fournisseurs SaaS et distinguer la gouvernance de l'IA intégrée de celle de l'IA utilisée directement.

Questions fréquentes

Mon fournisseur SaaS peut-il envoyer mes données vers un LLM sans mon accord?

Au regard du RGPD, non : tout recours à un sous-traitant ultérieur nécessite une autorisation écrite préalable du responsable de traitement. En pratique, beaucoup de DPA pré-2023 ne couvrent pas ce cas, et les grands éditeurs utilisent des mécanismes de notification sans consentement explicite. Le risque juridique est porté par le responsable de traitement, pas par le sous-traitant.

Comment détecter si mes outils SaaS utilisent des modèles d'IA en arrière-plan?

Les flux API vers les fournisseurs d'IA transitent côté serveur du SaaS, donc hors de votre réseau et invisibles de vos outils de supervision. Les leviers disponibles sont l'audit des release notes produit, la revue des mises à jour de DPA, et le recours à des plateformes spécialisées de privacy management qui cartographient les connexions IA déclarées ou détectées.

L'AI Act couvre-t-il ce problème de sous-traitance IA indirecte?

Non dans sa forme actuelle. L'AI Act cible les fournisseurs et déployeurs de systèmes d'IA, pas les éditeurs SaaS qui intègrent un appel API vers un LLM comme fonctionnalité secondaire. Ce cas de figure tombe dans un angle mort entre le RGPD (sous-traitance) et l'AI Act (systèmes d'IA), sans régulation unifiée.

Le brief tech qui compte
Chaque matin à 7h, les 5 signaux tech B2B à ne pas manquer.