Ip: il rebus degli algoritmi creativi
di giuseppe salemme
Il 13 gennaio 2023, tre disegnatrici statunitensi hanno intentato una class action contro tre società attive nel campo dell’intelligenza artificiale (nello specifico Stability AI, Midjourney e Deviantart) per violazione del copyright sulle loro opere. Le artiste (la fumettista Sarah Andersen e le illustratrici Karla Ortiz e Kelly McKernan), rappresentate dall’avvocato Joseph Saveri, sostengono che i “generatori di immagini” messi a disposizione del grande pubblico da queste società, e divenuti virali negli ultimi mesi, sfruttino senza consenso le loro creazioni per “insegnare” ai loro algoritmi a riprodurre il loro stile, permettendo agli utenti di creare istantaneamente decine di immagini che sembrino effettivamente a loro riconducibili.

Per il meccanismo della class action statunitense, qualora la corte federale di San Francisco decidesse di sostenere le tesi delle ricorrenti, anche altri artisti o detentori di diritti d’autore potrebbero aggregarsi alle tre ricorrenti originali e chiedere un risarcimento per le violazioni; ed è per questo che la portata di questa vicenda è stata descritta come in grado di condizionare pesantemente lo sviluppo delle intelligenze artificiali generative (di cui abbiamo parlato nello scorso numero di MAG https://legalcommunity.it/chatgpt-gli-avvocati-il-mio-obiettivo-non-e-sostituirli/), anche perché quello appena descritto non è l’unico contenzioso del genere emerso negli ultimi mesi. C’è chi sostiene che siamo all’inizio di una lunga guerra tra società di IA e detentori di diritti d’autore. Ma è effettivamente così?
Vittorio Cerulli Irelli, avvocato socio dello studio Trevisan & Cuonzo, è specializzato nelle controversie brevettuali tecnologiche “di frontiera”: negli ultimi anni ha seguito ad esempio i primi contenziosi relativi agli algoritmi di riconoscimento visivo presenti nelle telecamere delle automobili. A MAG ha spiegato quali sono i profili giuridici problematici del funzionamento di IA come ChatGpt o come quelle citate in giudizio negli Usa. «Internet è una miniera inesauribile di materiale indicizzato, che include anche contenuti protetti da diritto d’autore. E le società di IA lo raccolgono tutto, indiscriminatamente, con una tecnica chiamata “web scraping” (letteralmente “raschiare il web”, ndr), per poi usarlo per addestrare i loro algoritmi».
Già su questo primo punto emergono le prime complessità. L’avvocato spiega innanzitutto che tecniche di “data mining” come il web scraping, almeno in Europa, sono disciplinate dalla direttiva europea sul copyright (2019/790), che le considera lecite se a svolgerle sono enti di ricerca, istituti culturali o comunque enti non lucrativi. Se, invece, la raccolta di dati è opera di un’impresa commerciale, ai titolari dei diritti d’autore è consentito sottrarsene tramite un opt-out. Ma anche qualora l’opt-out fosse avvenuto, rimane un problema: la prova. «Come si fa a provare che il data-set utilizzato per addestrare l’IA conteneva contenuti protetti? A parte qualche rara eccezione, la maggior parte dei data set sono black boxes, non consultabili liberamente», fa presente Cerulli Irelli. In alcuni casi questo problema potrebbe rivelarsi aggirabile: l’agenzia fotografica americana Getty Images, ad esempio, ha citato in giudizio Stability AI presso la corte federale del Delaware e presso l’High Court inglese, lamentando l’utilizzo senza consenso di milioni di immagini protette. «Il data-set usato da…
PER PROSEGUIRE LA LETTURA CLICCA QUI E SCARICA LA TUA COPIA DI MAG