L’universo dell’intelligenza artificiale generativa, nuova frontiera tecnologica su cui si concentrano gli investimenti delle più grandi aziende del mondo, finisce ancora una volta nell’occhio del ciclone legale legato al mondo della pirateria. Questa volta, a finire sul banco degli imputati è Apple, colosso di Cupertino che solo pochi mesi fa ha presentato con grande clamore la sua suite di funzionalità AI, “Apple Intelligence”.

L’accusa, pesante come un macigno, è di aver utilizzato illegalmente migliaia di libri piratati per addestrare i propri sistemi di intelligenza artificiale.

Apple sotto accusa, piratati libri per addestrare l’IA?

A intentare la causa sono due accademici e autori di spicco, Susana Martinez-Conde e Stephen Macknik, entrambi professori presso la SUNY Health Sciences University.

Secondo gli atti depositati presso un tribunale federale, Apple avrebbe attinto a piene mani da un controverso dataset noto come “Books3” per nutrire e affinare i suoi modelli linguistici, tra cui il sistema OpenELM.

I due professori sostengono che i loro libri, Champions of Illusion e Sleights of Mind, siano stati copiati e utilizzati senza alcuna autorizzazione, in palese violazione delle leggi sul copyright e sulla cosiddetta pirateria.

Il fulcro della disputa è il dataset “Books3”, una massiccia raccolta digitale che, prima della sua rimozione alla fine del 2023 a seguito di numerose denunce per violazione di copyright, conteneva oltre 186.000 libri.

Queste opere non provenivano da fonti legittime, ma erano state recuperate tramite scraping da Bibliotik, un tracker BitTorrent privato noto per la condivisione illegale di materiale protetto da diritto d’autore.

Books3 era a sua volta una componente di “The Pile”, una colossale collezione di dati open-source da 825 BG, ampiamente utilizzata da ricercatori e aziende per l’addestramento di modelli di linguaggio di grandi dimensioni (LLM).

I querelanti affermano che Apple, utilizzando dati derivati da The Pile, si è servita direttamente di questo archivio pirata per costruire le fondamenta della sua intelligenza artificiale, ottenendo un ingiusto vantaggio competitivo.

L’azienda avrebbe, di fatto, sfruttato il lavoro intellettuale di migliaia di autori per sviluppare una tecnologia da cui ora trae profitto, senza riconoscere alcun compenso né chiedere il permesso.

Nella denuncia si sottolinea un paradosso significativo: Apple avrebbe beneficiato dell’uso di contenuti protetti da copyright e, allo stesso tempo, avrebbe sviluppato meccanismi di salvaguardia per impedire che le sue IA riproducano testualmente quelle stesse opere nelle risposte fornite agli utenti. Una mossa che, secondo i legali dei professori, dimostra la consapevolezza dell’illecito.

Un banco di prova per la legge sul copyright nell’era dell’IA

Questo caso si aggiunge a una crescente ondata di azioni legali che vedono contrapposti creatori di contenuti e giganti tecnologici. Da OpenAI a Microsoft, passando per Google, quasi tutte le principali aziende che sviluppano IA sono state accusate di pratiche simili.

Queste cause legali stanno diventando un fondamentale banco di prova per definire i confini del copyright nell’era dell’intelligenza artificiale.

Gli esperti legali concordano sul fatto che la sfida principale per i professori Martinez-Conde e Macknik sarà dimostrare in modo inequivocabile che i loro specifici libri erano presenti nel set di dati utilizzato da Apple e che sono stati effettivamente “processati” dai suoi modelli.

Sebbene Apple abbia ammesso in passato di aver utilizzato dataset legati a The Pile, non è ancora chiaro se i titoli in questione fossero inclusi.

I querelanti hanno inoltre collegato il presunto danno finanziario subito alla crescita del valore delle azioni di Apple registrata dopo l’annuncio delle sue nuove funzionalità AI, un nesso che, secondo gli analisti, potrebbe essere complesso da provare in tribunale.

Ad oggi, Apple non ha rilasciato una risposta ufficiale alla causa. Tuttavia, la posta in gioco è altissima. La legislazione statunitense prevede sanzioni che possono arrivare fino a 150.000 dollari per ogni singola opera violata intenzionalmente.

Oltre al risarcimento monetario, gli autori chiedono un’ordinanza del tribunale che vieti permanentemente ad Apple di utilizzare i loro lavori.

L’esito di questa e di altre battaglie legali simili è destinato a plasmare il futuro dello sviluppo dell’IA, determinando fino a che punto le aziende tecnologiche potranno spingersi nell’attingere al vasto patrimonio creativo esistente per costruire i loro potenti algoritmi.