Claude a trouvé vos failles avant votre équipe sécu : le vrai problème, c'est ce qui se passe après

Anthropic a publié fin juin les résultats d'un programme interne où Claude, son modèle de langage, a été utilisé comme outil de recherche offensive en cybersécurité. Le projet s'appelle Mythos. L'idée : faire tourner le modèle sur des bases de code open source et propriétaires pour identifier des vulnérabilités exploitables, sans intervention humaine dans la boucle de découverte.
Claude a remonté deux zero-days confirmés. Anthropic ne détaille pas les logiciels concernés — les correctifs sont en cours de coordination avec les éditeurs via des canaux de divulgation responsable. Ce qu'on sait : les deux failles touchent des composants utilisés dans des environnements d'entreprise, pas des projets marginaux.
Le communiqué d'Anthropic insiste sur la capacité de Claude à raisonner sur du code complexe, à identifier des chemins d'exécution non évidents et à produire des preuves de concept fonctionnelles. Le tout en quelques heures de compute.
Le delta
L'exercice est impressionnant. Mais il éclaire surtout un décalage structurel que les équipes de sécurité opérationnelle vivent au quotidien. Le temps moyen de remédiation d'une vulnérabilité critique dans une grande entreprise tourne autour de 60 jours, selon les données agrégées par plusieurs éditeurs de gestion de surface d'attaque. Pour les vulnérabilités de sévérité haute mais pas critique, on dépasse régulièrement les 100 jours. Ce n'est pas un secret. C'est un fait opérationnel.
L'arrivée d'outils capables de découvrir des failles à la vitesse d'un appel API ne change rien à cette réalité si le pipeline de remédiation reste le même : ticket ITSM, validation du changement, fenêtre de maintenance, test de régression, déploiement progressif. Dans les environnements régulés — banque, santé, industrie — ajoutez une couche de conformité.
Google Project Zero, qui traque les zero-days depuis 2014, publie chaque année ses statistiques de délai de correction par éditeur. En 2023, le délai moyen entre notification et patch disponible chez les grands éditeurs était de 52 jours. Entre patch disponible et patch appliqué chez le client, personne ne mesure de manière fiable. C'est dans cet angle mort que les attaquants travaillent.
Offensive asymétrique
Le problème que Mythos rend visible, c'est l'asymétrie qui va s'aggraver. Si un modèle commercial comme Claude peut trouver des zero-days dans du code de production, les groupes offensifs — étatiques ou criminels — le peuvent aussi. Certains le font probablement déjà. Le coût de la découverte offensive vient de s'effondrer. Le coût de la remédiation défensive, lui, n'a pas bougé.
Anthropic présente Mythos comme un outil défensif, un moyen de trouver les failles avant les attaquants. C'est la ligne officielle de tous les programmes de ce type — Google a son Big Sleep, Microsoft finance des projets similaires via MATTR. La difficulté, c'est que la même capacité fonctionne dans les deux sens. Et dans un sens, il n'y a pas de processus de change management à respecter.
Jason Healey, chercheur à Columbia et ancien directeur de la cybersécurité à la Maison Blanche sous Obama, a résumé le problème en une phrase il y a deux ans : « Nous avons industrialisé la découverte de vulnérabilités sans industrialiser leur correction. » La phrase n'a fait que gagner en pertinence.
Le patch n'est pas un livrable
Dans la plupart des organisations, le patching reste un processus semi-manuel, dépendant de la disponibilité des équipes infrastructure, contraint par des SLA applicatifs et ralenti par la peur légitime de casser quelque chose en production. Les outils de patch management existent — WSUS, SCCM, Tanium, Qualys — mais ils automatisent la distribution, pas la décision.
Et c'est la décision qui prend du temps. Faut-il patcher ce serveur Oracle qui tourne une appli métier critique dont personne ne maîtrise plus le code ? Le CAB se réunit jeudi, la fenêtre de maintenance est dimanche. La faille a été publiée lundi. Cinq jours d'exposition documentée, avec un exploit déjà en circulation sur GitHub.
L'équipe d'Anthropic qui a conduit Mythos travaillait depuis un bureau de San Francisco un samedi. Le rapport mentionne que la seconde vulnérabilité a été identifiée pendant un run non supervisé lancé le vendredi soir.
Ce que Mythos démontre n'est pas que l'IA est meilleure que les pentesters humains. Les chercheurs en sécurité font ce travail depuis des décennies avec des résultats remarquables. Ce que Mythos démontre, c'est que le coût marginal de la découverte tend vers zéro, pendant que le coût marginal de la correction reste constant. C'est un problème économique avant d'être un problème technique.
Anthropic vend quelque chose
Il faut le dire : Anthropic a un intérêt commercial direct à montrer que Claude est capable de trouver des zero-days. C'est un argument de vente pour les contrats gouvernementaux et les grands comptes qui évaluent les capacités avancées des modèles. Le programme Mythos est aussi un exercice de positionnement. Anthropic se présente comme le fournisseur d'IA « responsable » — montrer qu'on utilise son propre modèle pour la sécurité offensive, dans un cadre contrôlé, alimente ce récit.
En mars 2024, Anthropic affirmait que Claude n'était pas capable de contribuer de manière significative à la découverte de vulnérabilités. C'était dans leur Responsible Scaling Policy, mise à jour pour le lancement de Claude 3. Quinze mois plus tard, le même modèle trouve des zero-days en production.
La progression des capacités est réelle. L'encadrement du récit aussi.
Pour les DSI et les RSSI, le takeaway concret est plus prosaïque : le temps dont vous disposez entre la découverte d'une faille et son exploitation active est en train de se réduire structurellement. Pas à cause d'un modèle en particulier, mais parce que la catégorie entière — LLM appliqués à la recherche de vulnérabilités — arrive à maturité. Si votre processus de patching critique prend encore 45 jours en moyenne, le calcul de risque a changé.
Matt Johansen, ancien VP de la recherche chez Qualys, a publié une analyse du programme Mythos dans laquelle il note que « la vraie question n'est pas de savoir si l'IA trouve des failles — c'est de savoir si les défenseurs peuvent absorber le volume de découvertes qui arrive. »
Personne n'a encore répondu.
TL;DR
Claude d'Anthropic a découvert deux zero-days réels lors d'un exercice de red teaming automatisé — mais la vraie faille mise en lumière, c'est le délai de remédiation des entreprises.
• Le programme Mythos montre que le coût de découverte de vulnérabilités par IA tend vers zéro, tandis que le coût de correction en entreprise reste inchangé.
• Le délai médian entre publication d'un correctif et son application en production dépasse souvent 60 jours dans les grandes organisations — un angle mort que les attaquants exploitent déjà.
• Anthropic a un intérêt commercial direct dans cette démonstration : en mars 2024, la même entreprise estimait que Claude ne pouvait pas contribuer significativement à la découverte de vulnérabilités.
Questions fréquentes
Claude a-t-il trouvé des failles dans des logiciels identifiés publiquement ?
Non. Anthropic n'a pas révélé les logiciels concernés, invoquant un processus de divulgation responsable en cours avec les éditeurs. On sait seulement que les composants sont utilisés en environnement d'entreprise.
En quoi cela change-t-il concrètement le risque pour une DSI ?
Le temps entre découverte d'une faille et son exploitation active se réduit. Si votre processus de patching critique prend plus de 30 jours, votre fenêtre d'exposition réelle s'élargit mécaniquement, parce que les outils de découverte — offensifs comme défensifs — accélèrent plus vite que les processus de remédiation.
D'autres fournisseurs d'IA font-ils la même chose ?
Google a lancé Big Sleep, un projet similaire qui a déjà identifié une vulnérabilité dans SQLite. Microsoft finance des programmes de recherche offensive via IA. La tendance est transversale à l'industrie, pas spécifique à Anthropic.