Crédit photo : Snowscat
Cinq éditeurs de livres et un auteur affirment que le PDG de Meta, Mark Zuckerberg, a personnellement autorisé une violation massive du droit d’auteur pour entraîner l’IA de l’entreprise.
Meta et son fondateur et PDG Mark Zuckerberg font face à une action en justice pour violation du droit d’auteur de la part de cinq éditeurs de livres et de l’auteur Scott Turow, alléguant que la société a téléchargé des millions d’œuvres protégées par le droit d’auteur à partir de sites pirates notoires pour entraîner son IA, sur instruction directe de Zuckerberg.
Le procès a été déposé mardi 5 mai auprès du tribunal de district américain du district sud de New York par les éditeurs Nachette, Macmillan, McGraw Hill, Elsevier et Cengage, ainsi que Turow individuellement. La poursuite est un recours collectif proposé et vise un montant non précisé en dommages-intérêts pour la violation alléguée.
“Dans leurs efforts pour gagner la ‘course aux armements’ de l’IA et construire un modèle d’IA génératif fonctionnel, les accusés Meta et Zuckerberg ont suivi leur devise bien connue : ‘avancer vite et casser les choses'”, indique le procès. « Ils ont d’abord téléchargé illégalement des millions de livres et d’articles de revues protégés par le droit d’auteur provenant de sites pirates notoires et téléchargé des extraits Web non autorisés de pratiquement tout l’Internet. »
“Ils ont ensuite copié ces fruits volés à plusieurs reprises pour former le système d’IA générative de Meta, valant plusieurs milliards de dollars, appelé Llama”, poursuit le dossier. « Ce faisant, les accusés se sont livrés à l’une des violations les plus massives de documents protégés par le droit d’auteur de l’histoire. »
Un porte-parole de Meta dit Variété: “L’IA stimule les innovations transformatrices, la productivité et la créativité des individus et des entreprises, et les tribunaux ont estimé à juste titre que la formation de l’IA sur des matériaux protégés par le droit d’auteur peut être considérée comme une utilisation équitable. Nous combattrons ce procès de manière agressive.”
À ce propos, les auteurs ont poursuivi les sociétés d’IA pour violation du droit d’auteur et ont perdu. En juin 2025, un juge fédéral a rejeté une plainte déposée par 13 auteurs, dont la comédienne Sarah Silverman. Ils ont allégué que Meta avait violé leurs droits d’auteur en entraînant son modèle d’IA sur leurs livres, mais le juge a statué que cela constituait une « utilisation équitable », malgré les rumeurs selon lesquelles Meta avait piraté quelque 200 000 livres pour entraîner son modèle d’IA générative.
Ce qui rend cette remise des gaz différente, c’est que Turow et les éditeurs allèguent spécifiquement que les employés de Meta ont délibérément contourné les protections du droit d’auteur à la demande de Zuckerberg après avoir initialement envisagé de passer par les canaux appropriés et de payer pour obtenir une licence pour ces œuvres. Par conséquent, le procès soutient qu’un tel comportement ne relève pas de la protection contre l’usage équitable.
Le procès affirme que Meta a envisagé des accords de licence avec de grands éditeurs, et que cela nécessiterait d’augmenter le budget de « licences d’ensembles de données » de l’entreprise jusqu’à 200 millions de dollars de janvier à avril 2023. Cependant, l’entreprise a ensuite « brusquement arrêté sa stratégie de licence », car la question de la licence a été « transmise » à Zuckerberg.
À ce stade, l’équipe de développement commercial de Meta a reçu des instructions verbales pour mettre fin aux efforts de licence, un employé ayant déclaré : « Si nous accordons une licence à (un) seul livre, nous ne pourrons pas nous appuyer sur la stratégie d’utilisation équitable. »
“Meta, sous la direction de Zuckerberg, a copié des millions de livres, d’articles de journaux et d’autres ouvrages écrits sans autorisation, y compris ceux détenus ou contrôlés par les plaignants et le groupe, puis a fait des copies supplémentaires de ces ouvrages pour former Llama”, affirme la poursuite. “Zuckerberg lui-même a personnellement autorisé et encouragé activement la violation. Meta a également supprimé (les informations sur la gestion des droits d’auteur) des œuvres protégées par le droit d’auteur qu’elle a volées. Elle l’a fait pour dissimuler ses sources de formation et faciliter leur utilisation non autorisée.”
En décembre 2023, les salariés de Meta a commencé à faire circuler un mémo concernant les risques juridiques liés à l’utilisation du référentiel en ligne LibGen pour obtenir du matériel protégé par le droit d’auteur. Ce mémo décrivait cet ensemble de données comme « nous savons qu’il est piraté » et que la société « ne divulguerait pas l’utilisation des ensembles de données LibGen utilisés pour l’entraînement ».
“En fin de compte, cependant, ces préoccupations sont restées lettre morte”, indique le procès. “Zuckerberg et d’autres dirigeants de Meta ont autorisé et dirigé le torrenting de plus de 267 To de matériel piraté, soit l’équivalent de centaines de millions de publications et plusieurs fois la taille de l’ensemble de la collection imprimée de la Bibliothèque du Congrès.”
En conséquence, le procès affirme que le système d’IA de Meta « génère facilement, à grande vitesse et à grande échelle, des substituts aux travaux des demandeurs et du groupe sur lesquels il a été formé ». Celles-ci peuvent prendre de nombreuses formes, telles que « des copies textuelles et quasi-textuelles, des chapitres de remplacement de manuels universitaires, des résumés et des versions alternatives de romans et d’articles de revues célèbres, des contrefaçons de qualité inférieure qui copient des éléments créatifs d’œuvres originales et des œuvres dérivées ».

