Meta ha dichiarato in un documento legale di aver scaricato 82 TB di materiale protetto da copyright tramite torrent per addestrare i suoi modelli di intelligenza artificiale LLaMA, ma sostiene che i dipendenti "hanno preso precauzioni per non 'condividere' i file scaricati".
La difesa di Meta si basa sull'affermazione che non ci sarebbero prove che l'azienda abbia effettivamente condiviso il materiale durante il processo di download tramite torrent. Tuttavia, Michael Clark, un dirigente di Meta, ha testimoniato che le impostazioni di configurazione sono state modificate "in modo che potesse avvenire la minima quantità possibile di condivisione".
Questa dichiarazione ha sollevato parecchi dubbi sulla reale portata delle precauzioni adottate da Meta. Inoltre, un messaggio interno di Frank Zhang, ricercatore presso Meta, potrebbe indicare un tentativo di nascondere la potenziale condivisione dai server di Facebook per evitare di risalire all'origine del download.
Se Meta dovesse vincere la causa attualmente in corso, basandosi su questa linea difensiva e dimostrando che scaricare contenuti protetti da copyright non è illegale ma lo è la distribuzione, potrebbe avere importanti ripercussioni su tutti i futuri casi di pirateria e distribuzione non autorizzata di materiale coperto da diritti d'autore.
Gli autori del materiale protetto da copyright hanno accusato Meta di aver "aggirato i metodi di acquisizione legali diventando consapevolmente partecipe di una rete di pirateria peer-to-peer illegale". La battaglia legale è destinata a proseguire, con Meta che probabilmente farà appello in caso di sconfitta.
Casi simili vedono coinvolte altre aziende tech: OpenAI è stata citata in giudizio da alcuni romanzieri nel 2023, mentre il New York Times ha fatto causa a OpenAI e Microsoft per aver copiato "milioni" di articoli di notizie. La lista di contenziosi legati ai modelli linguistici di grandi dimensioni continua ad allungarsi, e questo caso specifico di Meta non sarà probabilmente l'ultimo.
La vicenda solleva importanti questioni etiche e legali sull'utilizzo di materiale protetto da copyright per l'addestramento di sistemi di intelligenza artificiale, un tema destinato a rimanere al centro del dibattito nei prossimi anni, oltre che sulla reale colpa di chi scarica tali contenuti per semplice "uso personale".
Questo commento è stato nascosto automaticamente. Vuoi comunque leggerlo?