Meta est accusé d’avoir téléchargé 81 To de livres piratés pour entraîner son intelligence artificielle. Des courriels internes révèlent que l’entreprise aurait tenté de dissimuler ses pratiques, malgré les inquiétudes de certains employés. Comment une telle opération a-t-elle été mise en place ? Voici ce que l’enquête révèle.
Meta accusé d’avoir piraté des millions de livres pour entraîner son IA
Meta est au cœur d’une polémique sur le droit d’auteur. L’entreprise est accusée d’avoir téléchargé plus de 81 téraoctets de livres piratés pour entraîner ses modèles d’intelligence artificielle. Des courriels internes révèlent que certains employés étaient conscients de la légalité douteuse de cette pratique, soulevant de nombreuses questions sur l’éthique et la responsabilité des grandes entreprises technologiques.
Des torrents de livres piratés pour entraîner l’IA
Meta fait face à une nouvelle plainte pour violation du droit d’auteur après la publication de documents internes montrant que l’entreprise aurait utilisé des bibliothèques clandestines pour obtenir des millions d’ouvrages numériques. Selon les éléments révélés dans le cadre d’un procès en cours, l’entreprise aurait téléchargé 81,7 téraoctets de données via des sites bien connus du piratage, comme Anna’s Archive, Z-Library et LibGen.
Ces bibliothèques en ligne regroupent des livres, articles scientifiques et magazines protégés par le droit d’auteur, mais accessibles illégalement. Les courriels internes de Meta montrent que certains employés étaient conscients des risques légaux liés à ces téléchargements. L’un d’eux souligne ainsi qu’« utiliser du contenu piraté est éthiquement douteux », tandis qu’un autre s’inquiète du fait que « télécharger des torrents depuis la connexion du bureau » pourrait poser des problèmes juridiques.
Un point particulièrement préoccupant est que le protocole BitTorrent implique un partage des fichiers entre utilisateurs. Or, selon les documents déposés au tribunal, Meta aurait cherché à minimiser ce partage en modifiant certains paramètres techniques pour que les fichiers soient diffusés de la manière la plus restreinte possible. Cette tentative de dissimulation renforce les accusations portées contre l’entreprise.
🏴☠️ Meta Pirated 81.7TB of Books to Train AIhttps://t.co/dInNPoIp38
— Cosmico (@cosmicohq) February 6, 2025
Un scandale qui fragilise la défense de Meta
Face à ces révélations, Meta a adopté une stratégie juridique axée sur le fair use (usage loyal), un principe du droit américain qui permet d’utiliser des œuvres protégées dans certains cas spécifiques, comme la recherche ou l’éducation. L’entreprise affirme que son utilisation de ces bases de données s’inscrit dans ce cadre.
Cependant, des courriels internes semblent contredire la version officielle. Selon des documents non censurés récemment publiés, la décision d’utiliser ces bibliothèques pirates aurait été prise après consultation de Mark Zuckerberg. Cette information fragilise la défense de Meta, qui avait initialement nié toute implication de son PDG dans cette affaire.
Les auteurs à l’origine de la plainte assurent que ces révélations élargissent la portée de leur accusation, en montrant que Meta n’a pas seulement utilisé des livres piratés, mais a aussi tenté de masquer ses activités. Le procès en cours pourrait établir un précédent majeur dans la régulation de l’intelligence artificielle et la responsabilité des entreprises technologiques face aux violations du droit d’auteur.
Alors que Meta tente de minimiser l’impact de ces accusations, cette affaire met en lumière les pratiques controversées utilisées pour entraîner les modèles d’intelligence artificielle et soulève des questions plus larges sur l’éthique et la transparence dans le secteur technologique.