Anthropic distribue son modèle le plus puissant à 45 organisations triées sur le volet - et refuse de le rendre public

L'annonce a été faite sans keynote, sans démo live, sans page produit. Un billet de blog d'Anthropic, publié un mardi matin à 6 heures heure du Pacifique, détaille les grandes lignes du Project Glasswing : une enveloppe de 100 millions de dollars, un modèle présenté comme significativement plus performant que Claude 4 Opus sur les benchmarks internes d'Anthropic, et un accès limité à 45 organisations partenaires dont les noms ont été rendus publics par lots, certains confirmés par les intéressés, d'autres pas.
Le périmètre affiché est la cybersécurité défensive. Détection de vulnérabilités zero-day, analyse automatisée de code malveillant, modélisation de chaînes d'attaque complexes. Anthropic parle de « capacités qui n'existaient pas il y a six mois dans aucun système accessible au public ». La formulation est calibrée.
Dario Amodei, CEO d'Anthropic, dans un entretien accordé à un média américain : « Nous avons atteint un point où la puissance brute du modèle crée un risque de prolifération que nous ne pouvons pas gérer avec nos mécanismes de sécurité actuels en accès ouvert. La distribution contrôlée n'est pas un choix commercial, c'est une obligation de responsabilité. »
La liste des 45 organisations inclut quatre des cinq plus grosses capitalisations mondiales, plusieurs agences fédérales américaines (le DOD et la CISA sont mentionnés explicitement), des opérateurs télécoms, des banques systémiques, et une poignée de CERT nationaux européens. Aucune entreprise française n'apparaît dans la liste publiée. L'ANSSI n'a pas commenté.
45 noms, zéro prix
Anthropic ne communique aucun tarif. Le modèle n'est pas accessible via l'API standard, ni via Amazon Bedrock, ni via Google Cloud Vertex AI — les deux canaux de distribution habituels de Claude. Les partenaires accèdent à Mythos via une infrastructure dédiée, hébergée par Anthropic, avec des contrôles d'usage décrits comme « plus stricts que ceux appliqués à n'importe quel modèle commercial existant ». Chaque requête est auditée. Les outputs sont filtrés par une couche de classification distincte du modèle principal. Les organisations signataires s'engagent contractuellement à ne pas utiliser le modèle pour des opérations offensives.
Amazon Web Services et Google Cloud, tous deux investisseurs majeurs dans Anthropic (respectivement jusqu'à 4 milliards et 2 milliards de dollars engagés), figurent parmi les 45 partenaires, mais pas en tant que distributeurs. Ils sont utilisateurs. C'est un changement de posture notable : les hyperscalers, habitués à revendre les modèles d'Anthropic avec marge, se retrouvent ici dans le rôle de clients d'un programme dont ils ne contrôlent ni l'infrastructure ni les conditions d'accès.
Microsoft est dans la liste. Microsoft, qui a investi plus de 13 milliards de dollars dans OpenAI et distribue GPT-4o et o3 à travers Azure. L'entreprise n'a publié aucun communiqué. Un porte-parole s'est contenté de confirmer la participation « dans le cadre de nos engagements en matière de sécurité de l'écosystème ».
Le précédent qui n'en était pas un
Il y a dix-huit mois, Anthropic publiait sa Responsible Scaling Policy, un document-cadre qui définissait des niveaux de risque (ASL-1 à ASL-4) et les mesures de confinement associées. ASL-3 était décrit comme le seuil à partir duquel un modèle pourrait « significativement augmenter le risque d'attaques catastrophiques ». Claude 3.5 Sonnet avait été classé ASL-2. Anthropic ne précise pas le niveau ASL attribué à Mythos. Le billet de blog mentionne que le modèle « opère sous des contraintes de déploiement conçues pour ASL-3 et au-delà », sans jamais écrire ASL-4.
Le flou est délibéré ou pas. Mais il produit un effet : en refusant de classifier publiquement son propre modèle, Anthropic évite le débat sur le fait qu'un acteur privé auto-évalue ses risques avec sa propre grille.
OpenAI a publié un modèle de raisonnement avancé, o3, en accès API standard il y a trois mois. Google a rendu Gemini 2.5 Pro disponible dans son Threat Intelligence dès la semaine de son lancement. Les deux ont choisi la distribution large. Anthropic choisit l'inverse, et en fait un argument de marque.
100 millions
L'enveloppe de 100 millions couvre, selon Anthropic, l'infrastructure dédiée au programme, les équipes de sécurité affectées au monitoring en continu, et un fonds de recherche ouvert à des laboratoires académiques travaillant sur la détection de menaces assistée par IA. La répartition entre ces trois postes n'est pas détaillée. À titre de comparaison, Microsoft a annoncé en novembre dernier une « Secure Future Initiative » dotée de 20 milliards de dollars sur cinq ans — un chiffre qui inclut l'ensemble de ses investissements de sécurité produit, pas uniquement l'IA. Google a consacré 10 milliards en 2023 à la cybersécurité, toutes activités confondues.
Le million de dollars d'OpenAI pour son programme de grants cybersécurité, annoncé en 2023, paraît artisanal à côté. Mais les 100 millions d'Anthropic restent un montant modeste rapporté à ses besoins en compute : la société brûlait, selon ses propres projections partagées avec des investisseurs fin 2024, environ 2 milliards de dollars par an en coûts d'infrastructure.
Apple
La présence d'Apple dans la liste est la plus commentée. Apple n'a jamais intégré de modèle tiers dans ses produits de sécurité. Apple Intelligence, lancé avec iOS 18, repose sur des modèles entraînés en interne et, pour certaines tâches, sur un partenariat avec OpenAI. L'accord avec Anthropic, s'il dépasse le cadre du seul Project Glasswing, pourrait signaler un élargissement des fournisseurs de fondation d'Apple. Ou pas. Apple utilise peut-être Mythos uniquement pour auditer son propre code. Personne à Cupertino ne confirme ni n'infirme.
Un analyste de Gartner spécialisé en sécurité IA a noté, dans une réaction publiée le jour même, que « le vrai test de ce type de programme, c'est ce qui se passe quand un des 45 partenaires détecte une vulnérabilité critique grâce au modèle et doit la divulguer — les règles de disclosure classiques ne sont pas conçues pour des capacités asymétriques ». La question du responsible disclosure à l'ère d'un modèle réservé à une élite d'organisations n'est abordée nulle part dans le billet d'Anthropic.
Le billet a été publié à 6h01 PDT. Les équipes communication d'au moins trois des partenaires listés ont été prévenues moins de douze heures avant, selon des échanges consultés sur un canal Slack d'un CERT européen. L'un des messages, laconique : « On découvre qu'on est partenaire d'un truc qui n'a pas encore de nom public. »
Ce qui n'est pas dit
Aucun benchmark indépendant n'a été publié. Les affirmations de performance — « significativement supérieur à Claude 4 Opus » — proviennent exclusivement d'Anthropic. Le modèle n'a pas été soumis aux évaluations du METR (Model Evaluation and Threat Research), ni à celles de l'AI Safety Institute britannique, ni à l'AISI américain créé par décret exécutif en octobre 2023. Anthropic indique que des évaluations tierces sont « en cours de planification ».
Il n'y a pas de date de disponibilité élargie. Pas de feuille de route publique. Pas d'engagement à ouvrir l'accès si les conditions de sécurité le permettent. Le programme est présenté comme indéfini.
Pour les DSI et RSSI qui ne font pas partie des 45, l'annonce se résume à ceci : il existe désormais un modèle d'IA auquel ils n'ont pas accès, utilisé par leurs fournisseurs cloud, leurs concurrents bancaires ou leurs homologues américains pour détecter des vulnérabilités qu'ils devront, eux, chercher autrement.
Anthropic a levé 7,3 milliards de dollars depuis sa création. Sa dernière valorisation, lors d'un tour mené par Lightspeed Venture Partners début 2025, atteignait 61,5 milliards. Le Project Glasswing ne génère pas de revenus directs déclarés. Il génère autre chose : la preuve, adressée aux régulateurs et aux gouvernements, qu'Anthropic est le laboratoire qui bride volontairement ses propres capacités. Dans un contexte où le AI Safety Summit de Séoul et le sommet de Paris ont tous deux insisté sur la nécessité de mécanismes de contrôle pré-déploiement, c'est un positionnement qui vaut plus que 100 millions de dollars.
Dario Amodei, encore : « Nous préférons être critiqués pour avoir été trop prudents que pour avoir été trop rapides. »
En mars 2024, Anthropic avait supprimé une clause de sa politique d'utilisation qui interdisait explicitement les applications militaires. La modification avait été repérée par des chercheurs en gouvernance de l'IA, corrigée dans la formulation publique en moins de 48 heures, et qualifiée d'« erreur de mise à jour du document ».
TL;DR
Anthropic lance un modèle d'IA jugé trop puissant pour être public et le réserve à 45 organisations, dont Apple, Amazon, Google et Microsoft, pour un programme cyber défensif à 100 millions de dollars.
- Le modèle Mythos (Project Glasswing) n'est disponible ni via API ni via les clouds partenaires : accès uniquement sur infrastructure dédiée Anthropic, avec audit de chaque requête et interdiction contractuelle d'usage offensif.
- Aucun benchmark indépendant n'a été publié, aucune évaluation tierce n'est finalisée, et la classification de risque interne (ASL) du modèle n'est pas communiquée.
- Pour les DSI et RSSI hors du cercle des 45, l'asymétrie de capacité est immédiate : leurs pairs et fournisseurs ont accès à un outil de détection de vulnérabilités auquel eux n'ont aucun accès prévisible.
Questions fréquentes
Pourquoi Anthropic ne rend-il pas ce modèle accessible via ses canaux de distribution habituels (API, Bedrock, Vertex)?
Anthropic invoque un risque de prolifération lié aux capacités du modèle en matière de détection et potentiellement d'exploitation de vulnérabilités. La distribution restreinte permet un contrôle d'usage requête par requête, ce qui serait incompatible avec un accès API ouvert à grande échelle. C'est aussi un moyen de signaler aux régulateurs une posture de retenue volontaire.
Quel impact concret pour une entreprise qui n'est pas parmi les 45 partenaires?
À court terme, aucun accès au modèle ni à ses capacités de détection. L'asymétrie se manifeste si les organisations partenaires — banques, opérateurs, hyperscalers — identifient des vulnérabilités grâce à Mythos sans que les mécanismes de disclosure classiques suivent. Le risque est moins technique que structurel : une fragmentation de l'écosystème cyber entre ceux qui ont accès au modèle et les autres.
Ce type de distribution restreinte peut-il devenir un modèle pour d'autres laboratoires d'IA?
C'est la première fois qu'un acteur assume publiquement ce format. Si Anthropic parvient à en faire un avantage réputationnel et réglementaire sans perdre de terrain commercial, OpenAI et Google DeepMind seront sous pression pour proposer des dispositifs équivalents — ou pour justifier pourquoi ils ne le font pas.