La battaglia per il diritto d’autore nell'era dell'intelligenza artificiale

Avv. Giuseppe Croari – Dott.ssa Ilenia Lanari

All’inizio dell’ottobre scorso, due note case editrici americane, Dow Jones & Company Inc. – titolare del marchio The Wall Street Journal – e New York Post Holdins Inc. – titolare del marchio The New York Post -, hanno citato in giudizio la società Perplexity AI Inc., proprietaria dell’omonima piattaforma di intelligenza artificiale e motore di ricerca dialogico, con l’accusa di aver riprodotto numerosi articoli ed analisi delle due testate senza autorizzazione, violando dunque i diritti di copyright posti a protezione di detti contenuti.

Nell’attesa di future evoluzioni sulla controversia, un interrogativo sorge spontaneo: le aziende impegnate nel settore dell’intelligenza artificiale come utilizzano i contenuti protetti da copyright per “addestrare” i loro modelli?

Le accuse mosse contro Perplexity

Perplexity AI addestra i suoi modelli di ricerca attraverso contenuti reperiti sul web, fornendo agli utenti risposte riassuntive basate sulle fonti raccolte.

Secondo quanto sostenuto dalle testate anzidette, “i link alle fonti e i risultati delle ricerche visualizzabili su Perplexity AI sarebbero ottenuti sfruttando i contenuti giornalistici e i marchi delle due case editrici americane” (da Calò Simona, “Dopo il NYT, anche il Wall Street Journal e il New York Post fanno causa ad azienda di AI”, Il Quotidiano Giuridico).

In particolare, Perplexity AI sarebbe accusata di citare fonti sbagliate e, soprattutto, di attribuire erroneamente alle testate giornalistiche false notizie, causando, di conseguenza, gravi problemi a questi marchi ormai noti.

Sostanzialmente, il timore delle due testate giornalistiche è che i sistemi di intelligenza artificiale possano costituire una fonte alternativa di informazione, agganciandosi e sfruttando la notorietà delle aziende operanti nel settore dei media e comportando ripercussioni negative in termini economici (diminuendone il traffico e la pubblicità e non garantendo la veridicità delle informazioni).

Le implicazioni di un’interpretazione restrittiva per le aziende

Siccome le piattaforme generative di AI utilizzano numerose opere dell’ingegno presenti online per essere addestrate, ci si è interrogati su come evitare controversie relative alla violazione del diritto d’autore.

Tra le soluzioni vi è quella del “copyright by design”, ovvero imporre alla macchina di prendere e analizzare solo materiale che sia legalmente acquisibile e del quale si è, dunque, ottenuta l’autorizzazione.

Nel caso di specie, laddove il tribunale decidesse che le aziende di IA devono necessariamente ottenere l’autorizzazione per utilizzare i contenuti protetti da copyright, questo potrebbe avere un impatto anche su aziende diverse dai media. Infatti, questa decisione potrebbe influenzare:

Settore dell'IT: le aziende di software, in particolare quelle che sviluppano modelli di IA come GPT (Generative Pre-trained Transformers), sistemi di riconoscimento vocale e analisi dei dati, potrebbero trovarsi a dover affrontare sfide legali più complesse riguardo all'uso di contenuti protetti da copyright nei loro dataset;
Settore delle piattaforme social e delle ricerche online: le grandi piattaforme come Google, Meta, e Microsoft potrebbero essere direttamente coinvolte, visto che utilizzano contenuti di terze parti per alimentare i loro algoritmi e per addestrare i sistemi di intelligenza artificiale;
Settore della pubblicità: la pubblicità digitale, che si basa su grandi volumi di dati per l'analisi dei comportamenti e la targhettizzazione degli annunci, potrebbe subire un rallentamento se vengono applicate nuove restrizioni sull’utilizzo dei contenuti di terzi;
Modifiche alle pratiche di raccolta dei dati: se la controversia dovesse stabilire che le aziende di AI non possono utilizzare contenuti protetti da copyright senza una licenza, le stesse potrebbero anche essere costrette a rivedere la raccolta e la gestione dei dati;
Modifiche ai modelli di business nel settore dell'IT: a livello pratico, aziende di AI e IT potrebbero essere costrette a modificare i loro modelli di business, investendo in modi più trasparenti e legittimi di acquisire dati per i loro modelli, riducendo la dipendenza da contenuti senza licenza. Dall’altro lato, le aziende che producono contenuti, come giornali e riviste, potrebbero trovare nuove opportunità di monetizzazione dei loro dati, vendendo l'accesso ai contenuti per scopi di addestramento di AI o negoziando licenze con le varie aziende del settore;
Risvolti sulla fiducia e sulla reputazione: le aziende del settore IT potrebbero dover affrontare una crisi di fiducia. Infatti, se le piattaforme da loro prodotte dovessero essere viste come strumenti che si appropriano di contenuti protetti senza il consenso degli autori, ciò potrebbe minare la credibilità nelle stesse.

Per saperne di più sulla regolamentazione europea dell’AI (AI ACT), invece, ti rimandiamo a questo articolo.

Regolamentazione AI e aziende

Quanto detto, dunque, potrebbe avere ampie ripercussioni non solo per le aziende operanti nel settore dei media e dell’informazione, ma anche per tutto il settore tecnologico.

In un panorama sempre più focalizzato sull'uso dei dati e dell'intelligenza artificiale, la controversia in oggetto potrebbe spingere verso una regolamentazione più severa, cambiare le dinamiche del mercato dei dati e influenzare i modelli di business nell'industria IT.

In ultima analisi, potrebbe promuovere una cultura di maggiore rispetto dei diritti d'autore e responsabilità nell'uso dei dati, che ha il potenziale di influenzare tutte le aziende che utilizzano AI e machine learning.

Se hai dubbi su quali misure giuridiche adottare per garantire la tutela degli utenti e allo stesso tempo tutelare il tuo business, rivolgiti ai nostri partner dello Studio Legale FCLEX, operano in tutta Italia e potranno aiutarti ad individuare le soluzioni migliori per il tuo caso concreto.