Una nuova causa contro Meta, la compagnia che possiede Facebook, Instagram e WhatsApp, sostiene che il CEO Mark Zuckerberg abbia permesso agli sviluppatori di addestrare la propria intelligenza artificiale utilizzano una libreria piena di contenuti piratati, tra cui anche libri e articoli di giornale.

Mark Zuckerberg avrebbe permesso l’addestramento dell’AI con contenuti piratati

Crediti: Meta

Il caso “Kadrey vs Meta” finirà in tribunale e un giudice dovrà stabilire se le accuse di aver addestrato l’intelligenza artificiale Llama (il modello alla base di Meta AI) con contenuti senza licenza sia fondata o meno. Secondo l’accusa, infatti, Meta avrebbe utilizzato la popolare piattaforma LibGen per ottenere materiale pirata con cui “infondere la conoscenza” alla propria AI.

LibGen è un “aggregatore di link” (così si descrive la compagnia) che fornisce l’accesso a materiale protetto da copyright e di conseguenza considerato illegale. Tra questi contenuti ci sarebbero anche libri e articoli firmati da Cengage Learning, Macmillan Learning, McGraw Hill, e Pearson Education. Nonostante le numerose cause, condanne e ordinanze di chiusura, LibGen opera sul web ancora liberamente.

Secondo i testimoni, sarebbe stato lo stesso Mark Zuckerberg a fornire l’autorizzazione per utilizzare LibGen nell’addestramento di almeno un modello di Llama. Meta non ha ancora commentato la vicenda, ma è chiaro che ci vorranno diversi mesi prima che la faccenda venga risolta in tribunale.

Unsealed court documents from February 5th, 2024, in Kadrey v. Meta show Meta (formerly Facebook) illegally torrented 81.7TB of data from "shadow libraries" such as Anna's Archive, Z-Library, and LibGen to train Meta artificial intelligence.



Highlights include:

– A senior AI… pic.twitter.com/Bqf60Hhbb6 — vx-underground (@vxunderground) February 8, 2025

Dei documenti legali trapelati in rete negli ultimi giorni, invece, indicano come Meta abbia scaricato circa 81.7 TB di materiale piratato tramite torrent da siti come Anna’s Archive, Z-Library e LibGen, per poi addestrare la propria intelligenza artificiale su questi contenuti. Nei documenti, inoltre, emerge come dirigenti e ricercatori fossero a conoscenza del fatto, con tanto di dubbi morali sollevati dalla questione.

Ultimo aggiornamento: 11 febbraio

