Nvidia Nie Avoir Utilisé des Livres Piratés pour Entraîner ses Modèles IA — Demande le Renvoyé de l'Affaire Anna's Archive

Contexte de l'Affaire et Accusations des Auteurs
L'affaire, initiée début 2024 devant le juge Jon Tigar, porte sur l'allégation que Nvidia aurait entraîné ses modèles (NeMo, Megatron) sur Books3 (contenu piraté de Bibliotik) et autres datasets pirates. La plainte amendée (16 janvier 2026) révèle des emails internes où des employés Nvidia contactent Anna's Archive pour accéder à ~500 To de données (200M livres piratés), obtenant le « green light » management malgré avertissements illégaux.
Auteurs (incluant Sarah Silverman) étendent à centaines d'autres via class action, réclamant dommages pour violation directe/vicarieuse/contributrice.
Défense Nvidia : « Spéculations Sans Preuves »
Dans sa motion to dismiss (29 janvier 2026), Nvidia argue :
- Pas de copie prouvée : Plaignants ne démontrent pas téléchargement/utilisation spécifiques de leurs œuvres Nvidia.
- Contacts ≠ Usage : Discussions Anna's Archive = évaluation sources, pas preuve acquisition ; « tout aussi plausible Nvidia n'a pas obtenu les œuvres ».
- Fair Use : Entraînement modèles = transformation (vs Anthropic fair use ruling Alsup).
- Datasets publics : Megatron/The Pile open-source ; plaignants contredits documentation Nvidia publique.
Nvidia critique recours « information and belief » = pêche discovery illégitime.

Détails Techniques des Accusations
Emails Discovery : Employé data strategy Nvidia contacte Anna's Archive ; semaine après, management approuve malgré « nature illégale ». Accès haute vitesse ~500 To offert ; pas preuve deal finalisé/paiement.
Datasets Impliqués :
- Books3 : 196k livres piratés (Bibliotik shadow library).
- The Pile : Inclut Books3 ; Nvidia donne accès clients corporate.
- Anna's Archive : « Plus grande bibliothèque ombre histoire humaine » ; domaines suspendus DCMA 2026.
Contexte Juridique IA et Perspectives
Précédents : Anthropic règle 1,5 Md$ vs risque ruling définitif ; OpenAI/MSFT motions fair use en cours. Nvidia : leader GPU (90% marché IA), cible datasets pirates industrie-wide (Meta, Google).
Enjeu : Si condamnation, fair use IA contesté ; compensation class action potentiellement milliards $. Décision motion Q2 2026 ; Anna's Archive reste en ligne malgré takedowns.
Nvidia : « Plaignants spéculent sans faits ; copyright exige preuve copie spécifique ». Auteurs : « Nvidia knowingly piraté pour avantage compétitif ». Bataille fair use IA s'intensifie.