Accusations liées aux archives de NVIDIA Anna

Crédit photo : Stefan Steinbauer

Alors qu’il cherche à consolider sa place de pionnier de l’IA, le géant de la fabrication de puces NVIDIA est accusé d’avoir entraîné l’IA sur la controversée « bibliothèque fantôme » Anna’s Archive.

Malgré conclure un accord Avec Universal Music Group (UMG) plus tôt ce mois-ci pour consolider sa place de partenaire en « IA responsable », le géant de la fabrication de puces NVIDIA a été accusé d’entraîner son IA sur des données récupérées par Anna’s Archive, le soi-disant site pirate notoire.

Vendredi, un recours collectif a été intenté contre NVIDIA en 2024 par plusieurs auteurs qui affirmaient que les modèles d’IA de l’entreprise avaient été illégalement entraînés sur leurs travaux. modifiéélargissant considérablement la portée du litige. Le procès modifié inclut désormais davantage de livres, d’auteurs et de modèles d’IA contrefaits, ainsi que des réclamations impliquant la controversée « bibliothèque fantôme » Anna’s Archive.

Malheureusement, les auteurs citer plusieurs e-mails internes de NVIDIA et des documents qui suggèrent que l’entreprise a sciemment téléchargé des millions d’œuvres protégées par le droit d’auteur pour entraîner ses modèles d’IA. Les documents suggèrent même que la société a délibérément collaboré avec Anna’s Archive pour acquérir ces œuvres, bien que Anna’s Archive ait prétendument averti NVIDIA que sa bibliothèque avait été acquise illégalement.

“Désespéré d’avoir des livres, NVIDIA a contacté Anna’s Archive – la plus grande et la plus audacieuse des bibliothèques fantômes restantes – au sujet de l’acquisition de ses millions de documents piratés et de ‘l’inclusion des archives d’Anna dans les données de pré-formation pour nos LLM'”, indique le dossier. « Parce qu’Anna’s Archive facturait des dizaines de milliers de dollars pour un « accès haut débit » à ses collections piratées (…) NVIDIA a cherché à savoir à quoi ressemblerait un « accès haut débit » aux données.

“Une semaine après avoir contacté Anna’s Archive, et quelques jours après avoir été avertie par Anna’s Archive de la nature illégale de leurs collections, la direction de NVIDIA a donné “le feu vert” pour procéder au piratage. Anna’s Archive a offert à NVIDIA des millions de livres piratés protégés par le droit d’auteur”, poursuit la plainte, indiquant qu’Anna’s Archive a promis de fournir à l’entreprise environ 500 téraoctets de données piratées.

Bien que Anna’s Archive ne soit pas la seule source piratée que NVIDIA a été accusée d’utiliser, elle est pertinente étant donné que Anna’s Archive est poursuivi en justice par Spotify et les majors– y compris UMG. La bibliothèque en ligne annoncé à la fin de l’année dernière, il avait « archivé environ 86 millions de fichiers musicaux », soit environ 99,6 % des écoutes, sur Spotify. La DSP et les labels n’ont pas perdu de temps pour attaquer Anna’s Archive avec un procès et une injonction.

Et tout cela survient quelques semaines seulement après qu’UMG a annoncé un partenariat avec NVIDIA pour « être un pionnier de l’IA responsable pour la découverte, la création et l’engagement musicaux ».

Vraisemblablement, UMG ne savait pas que NVIDIA n’avait peut-être pas obtenu ses données de manière éthique, mais la société se tient désormais entre le marteau et l’enclume si elle veut garantir que ses offres ne sont pas formées ou dérivées d’œuvres piratées. Reste à savoir si UMG mettra fin à sa collaboration avec le fabricant de puces.





Source link