martedì 30 marzo 2021

Le licenze dei siti della pubblica amministrazione: l'intervista di oggi con Andrea Borruso

Oggi sono stato intervistato da Andrea Borruso dell'Associazione onData, ente no profit che promuove l’apertura dei dati pubblici per renderli accessibili a tutti e che, tra i vari progetti, porta avanti da alcuni mesi la campagna #DatiBeneComune per una piena disponibilità e condivisione dei dati relativi all'epidemia COVID-19 in Italia.

Abbiamo parlato del tema spinoso delle licenze utilizzate dai siti dell'Istituto Superiore di Sanità e del Ministero della Salute e in generale dei problemi legati al licensing di dati pubblici in Italia.

Riporto qui sotto l'embedd del video; il video originario (comunque identico a questo) è disponibile sul canale YouTube di OnData qui.

Per approfondire il tema della proprietà intellettuale negli enti pubblici e delle licenze per dati, suggerisco i seguenti contenuti:

- La proprietà intellettuale nella PA e il riuso di dati pubblici: videolezione presso Università Bicocca, aprile 2020

Le licenze per dati: capirle una volta per tutte: intervento tenuto il 19 febbraio 2020 al Politecnico di Torino in occasione dell'evento FOSS4G-it

La proprietà intellettuale sui dati: scenari e problematiche della derivazione e integrazione di dataset: estratto dal libro “Software licensing & data governance. Tutelare e gestire le creazioni tecnologiche” (Apogeo Editore, settembre 2020)


 


venerdì 26 marzo 2021

Per una comprensione delle licenze free software e open source

Dopo l'articolo La proprietà intellettuale sui dati: scenari e problematiche della derivazione e integrazione di dataset (vedi), pubblico questo secondo estratto dal libro “Software licensing & data governance. Tutelare e gestire le creazioni tecnologiche” (Apogeo Editore, settembre 2020); opera liberamente riproducibile nei termini della licenza Creative Commons Attribution – Non Commercial – Share Alike 4.0 International. Maggiori dettagli sul libro: https://aliprandi.org/books/software-licensing-data-governance/.  


SOMMARIO

1. Introduzione alle licenze software – 1.1. Le licenze software: tra compravendita e locazione – 1.2. Le varie categorie di licenze per software – 2. Strumenti giuridici per rilasciare software in modalità open – 2.1. La soluzione del rilascio in pubblico dominio – 2.2. Le licenze permissive – 2.3. Le licenze di copyleft forte e la GPL come licenza capostipite – 2.4. La licenza GPL – 2.5. Le varie versioni della GPL e le altre licenze di copyleft forte – 2.6. La Affero GPL e il copyleft di rete – 2.7. Le licenze di copyleft debole – 3. Compatibilità tra licenze open source – 4. Il meccanismo del dual licensing (o multilicensing).

Di seguito trovate l'embedd da SlideShare, ma potete trovare il file anche su Zenodo (vai) e su Academia.edu (vai).



mercoledì 24 marzo 2021

Scienza aperta: Open Access e copyright nel mondo della ricerca (giornata di studi dell'Università della Tuscia)

Riporto lo streaming e i materiali di "Scienza aperta. Open Access e copyright nel mondo della ricerca", giornata di studi organizzata dal Centro di Ateneo per le Biblioteche (CAB) dell'Università della Tuscia in occasione dell’avvio del nuovo repository della ricerca DSpace CRIS.

Di seguito riporto anche le slides disponibili.



LO STREAMING


LE SLIDES

Le slides di Roberto Caso: https://zenodo.org/record/4629377.

martedì 23 marzo 2021

L'immagine del bene culturale tra diritto d'autore, norme di tutela e diritto al patrimonio: il seminario di Mirco Modolo

Giovedì 25 marzo 2021 alle ore 15:00 il dott. Mirco Modolo (Archivio Centrale dello Stato) terrà un seminario intitolato "L'immagine del bene culturale tra diritto d'autore, norme di tutela e diritto al patrimonio" nell'ambito del Dottorato di Ricerca Patrimoni archeologici, storici architettonici e paesaggistici mediterranei: sistemi integrati di conoscenza, progettazione dell'Università Aldo Moro di Bari. Introduce il prof. Giuliano Volpe, coordinatore del dottorato. L'evento si svolgerà interamente online e sarà visibile su YouTube anche per chi non è iscritto al dottorato (vedi il canale).

Riporto la locandina dell'evento.


EDIT: IL VIDEO INTEGRALE DEL SEMINARIO



lunedì 22 marzo 2021

L'eccessiva enfasi sull'immunità di gregge. Lo scenario sarà diverso da quello raccontato dai media (e va bene così)

Sabato tu TechEconomy2030.it è uscito un mio articolo intitolato "5 motivi per smettere di parlare di immunità di gregge" nel quale ho spiegato in modo dettagliato (e spero anche chiaro) perché a mio avviso "immunità di gregge" è un termine che trasmette un’aspettativa inverosimile sulla fine della pandemia e che quindi non andrebbe utilizzato, eventualmente sostituito da "immunità diffusa". Vi invito a leggerlo integralmente (clicca qui).

Credo davvero che raccontare la storiella dell'immunità di gregge come fosse un traguardo che una volta raggiunto ci restituirà la nostra vita di prima e ci premierà degli sforzi fatti con la campagna vaccinale sia solo "oppio per il popolo", una scelta di comunicazione volta da un lato a tranquillizzare gli animi dall'altro a rafforzare l'adesione alla vaccinazione. Ma non è certo uno scenario verosimile e scientificamente riconosciuto. Quindi, a mio modesto parere, chi vuole fare una comunicazione intellettualmente onesta sul futuro della pandemia deve smettere di parlare di immunità di gregge ed eventualmente parlare di immunità diffusa (che - sia chiaro - è già un'ottima prospettiva).

In questo post (che potrebbe essere periodicamente aggiornato) voglio però raccogliere alcune voci autorevoli che hanno detto sostanzialmente la stessa cosa.

1) Innanzitutto la prof.ssa Antonella Viola (Università di Padova) che nei giorni scorsi, intervistata su La7 sia a Piazzapulita (Formigli) sia a Otto e mezzo (Gruber), si è espressa in modo netto e cristallino, rilasciando le seguenti dichiarazioni.

Otto e mezzo, 15 marzo 2021 -> "Nella maggior parte delle persone questo virus si supera tranquillamente. I vaccini anti COVID hanno una bassa efficacia quindi l'immunità di gregge è matematicamente impossibile."

Piazzapulita, 18 marzo 2021 -> "Il nostro obiettivo non deve essere l'immunità di gregge ma mettere al sicuro le persone fragili. È il motivo per cui in estate saremo comunque fuori da questa situazione, perché avremo protetto le persone fragili con i vaccini. Anche se il virus continuerà a circolare non succederà nulla di speciale, perché si ammaleranno soltanto le persone giovani e sane, quelle per cui il Covid ha sintomi simili a una influenza". [VEDI VIDEO]


2) Paolo Giordano nell’illuminante articolo “Solo superando le trappole otterremo l’immunità” su Corriere.it scrive:

"La campagna vaccinale è stata presentata da diversi esperti come una specie di interruttore, che raggiunta una certa soglia spegnerà il contagio, eliminando il problema del tutto. È un eccesso di semplificazione ed è probabile che non avverrà nulla del genere. Le soglie dell’immunità di gregge sono variabili e dipendono da molti fattori […]. Allo stato attuale l’immunità di gregge, tirata in ballo di continuo dall’inizio della pandemia, potrebbe essere una chimera."


3) Il Dott. Nino Cartabellotta (Fondazione GIMBE) in un tweet del 14 marzo 2021 (vedi) ha dichiarato:

"Sino a quando non avremo un vaccino per gli under 16 possiamo parlare solo di % di popolazione vaccinata. Non di immunità di gregge".


4) Il 22 marzo 2021 Milena Gabanelli nella sua sempre efficace rubrica Dataroom per Corriere.it ha pubblicato l'articolo "Il Covid quando finirà? Con i vaccini può diventare come l’influenza: la data della ripartenza" (vedi) in cui scrive:

"Perché l’immunità di gregge è difficile da raggiungere? L’immunità di gregge è raggiunta quando grazie a una sufficiente percentuale di persone vaccinate si riesce a bloccare la circolazione del virus. Se avessimo un vaccino con efficacia contro il contagio al 100% e una copertura a lungo termine, tenendo conto della velocità di diffusione del virus con un R0 tra 2,5 e 3,5, il risultato si otterrebbe vaccinando il 60–72% della popolazione. Non è però questo il caso: i vaccini Pfizer e Moderna hanno un’efficacia contro il contagio del 95%, J&J del 72% e AstraZeneca, a seconda delle stime, del 62-82%. Tenendo conto di quest’ultimo parametro, l’immunità di gregge si potrebbe ottenere solo vaccinando almeno il 97% della popolazione: una percentuale irrealistica, anche considerando che c’è chi non vuol fare il vaccino. In più c’è la variante inglese che fa crescere l’R0 a 4,5 e con ogni probabilità aumenta la letalità del virus. Infine, non sappiamo ancora quanto durerà l’immunità nel tempo. Messe insieme tutte queste variabili è possibile capire, come sostengono gli esperti da tempo tra cui l’immunologa Antonella Viola, perché l’immunità di gregge se non un miraggio sia quantomeno un’incognita. Altra cosa invece è l’immunità di massa, cioè riuscire a proteggere l’80% della popolazione vaccinandola, traguardo a cui il commissario per l’emergenza Francesco Paolo Figliuolo vuole arrivare entro il mese di settembre. Nel frattempo la convivenza con il virus diventerà meno dannosa perché il progredire delle vaccinazioni ne abbasserà la letalità. E con strategie vaccinali corrette si può raggiungere l’obiettivo di ridurre la letalità di Covid-19 a quella dell’influenza ben prima del prossimo autunno."


5) Il Prof. Massimo Galli intervistato ad Agorà (Rai3) il 22 marzo 2021 ha dichiarato:

"Siamo lontani dall'idea di un vaccino in grado di sviluppare l'immunità di gregge, ma quelli che abbiamo dovranno essere aggiornati per le nuove varianti. Anche se va detto che quando un anziano vaccinato incontra il virus in qualche variante sconosciuta difficilmente dovrebbe finire in ospedale." 


6) Su Corriere.it (sezione Salute) il 25 marzo 2021 è uscito l'articolo "Covid: i motivi per cui l'immunità di gregge è probabilmente impossibile" di Silvia Turin (vedi), articolo che per struttura e contenuti sembra una rielaborazione del mio articolo pubblicato su TechEconomy2030.it. Si legge:

"Quello che inizia a delinearsi all'orizzonte, però, è la possibilità che la libertà guadagnata non coincida con l'immunità di gregge, ma con una ridotta, seppur efficace, immunità di massa"


7. In una intervista raccolta da Francesco Rigatelli e uscita su LaStampa del 3 aprile 2021 (pag. 5), il prof. Massimo Galli ha dichiarato: "Stiamo vaccinando per salvare vite, non per la mitica immunità di gregge".



giovedì 18 marzo 2021

Il mondo della scuola nell'era del COVID: convegno online il 20 marzo

Sabato 20 marzo per l'intera giornata si terrà un convegno online intitolato "Il mondo della scuola nell'era del COVID" e organizzato dal progetto internazionale Diritto del pensiero e delle espressioni artistiche e da AGIF Associazione Giuristi Italiani per la Famiglia, in collaborazione con il sito StudioCataldi.it. L'evento è accreditato ai fini della formazione professionale presso l'Ordine degli Avvocati di Avezzano (5 crediti).

Io sarò tra i relatori della mattinata e mi occuperò del tema Copyright e didattica online.

L'iscrizione è libera e gratuita ma è comunque richiesta la registrazione scrivendo agli indirizzi avv.manuelarinaldi@yahoo.it (per gli avvocati del Foro di Avezzano) e elenaquarta534@gmail.com per tutti gli altri interessati.

La sessione mattutina avrà inizio alle ore 9:30 e prevede i seguenti relatori: Prof. Avv. Manuela Rinaldi, Prof. Avv. Paolo Maci, Dott.ssa Elena Quarta, Avv. Paolo Maria Storani, Prof. Vincenzo Capodieci, Prof. Avv. Giorgio Fontana, Avv. Paola Perrone, Avv. Luisa Carpentieri, Avv. Simone Aliprandi, Prof. Ciro De Angelis, Prof. Vittorio Lodolo D'Oria, Dott. Remo Trezza, Dott. Fabrizio Cesareo

La sessione pomeridiana avrà inizio alle ore 15:30 e prevede i seguenti relatori: Avv. Paolo Maria Storani, Avv. Maria Chiara Landolfo, Notaio Anna Dellaquila, Prof.ssa Antonella Manca, Dott.ssa Maristella Taurino, Dott.ssa Isabel Martina, Prof. Avv. Paolo Maci.

Di seguito riporto la locandina con dettagli più precisi sui vari interventi (cliccare sull'immagine per ingrandirla o scaricarla).



martedì 9 marzo 2021

La ricerca sui vaccini fra brevetti e accesso aperto alla conoscenza scientifica: seminario di Roberto Caso

Questa mattina alle ore 11 Roberto Caso, professore associato presso l'Università di Trento e Delegato per l'open access e le politiche contro il plagio dello stesso ateneo, terrà un seminario online per il Dottorato di Ricerca in Scienze Giuridiche dell'Università di Perugia dal titolo "La ricerca sui vaccini fra brevetti e accesso aperto alla conoscenza scientifica".

Il seminario sarà trasmessa in streaming sulla pagina Facebook del dottorato a questo indirizzo: https://www.facebook.com/Dottorato-di-Ricerca-in-Scienze-Giuridiche-Perugia-225118854944990. Oppure guardalo direttamente nell'embedd qui sotto.

Sullo stesso argomento segnalo anche la chiacchierata divulgativa con il Prof. Giuseppe Mazziotti, tenutasi lo scorso 17 febbraio e disponibile su YouTube qui: https://youtu.be/oNFN031Y5Ws.


LA LOCANDINA


L'EMBEDD DELLO STREAMING FACEBOOK

mercoledì 3 marzo 2021

Copyright e licenze aperte per la cultura nel web: le 100 FAQ e la tavola rotonda di domani

Domani pomeriggio ci sarà una interessantissima giornata di studi online sul tema "Copyright e licenze aperte per la cultura nel web", aperta a chiunque previa registrazione. Segnalo in particolare le due tavole rotonde delle ore 15 e 16, a cui partecipano istituzioni ed esperti di primissimo piano che porteranno la loro esperienza concreta di soggetti che quotidianamente si scontrano con questi problemi.

Inoltre la prossima settimana (giovedì 11) ci sarà un secondo evento, sempre online, più dedicato all'interazione con gli operatori del settore cultura, che potranno sottoporre direttamente i loro quesiti agli esperti. Un'occasione davvero preziosa.

Maggiori informazione, brochure completa e form di iscrizione: http://www.icom-italia.org/copyright-e-licenze-aperte-per-la-cultura-nel-web-a-cura-del-gruppo-di-ricerca-digital-cultural-heritage-di-icom-italia/.

L'opuscolo PDF con le 100 domande/risposte è liberamente scaricabile QUI.


LO STREAMING DELL'EVENTO



La proprietà intellettuale sui dati: scenari e problematiche della derivazione e integrazione di dataset

La proprietà intellettuale sui dati: scenari e problematiche della derivazione e integrazione di dataset

Estratto dal libro “Software licensing & data governance. Tutelare e gestire le creazioni tecnologiche” (Apogeo Editore, settembre 2020); opera liberamente riproducibile nei termini della licenza Creative Commons Attribution – Non Commercial – Share Alike 4.0 International.

Sommario: 1. I concetti di “derivazione” e “integrazione” nel mondo delle banche dati – 1.1. Derivazione – 1.2. Integrazione – 2. Scenari più frequenti di integrazione e derivazione tra banche dati – 2.1. Integrazione di dataset preesistenti – 2.2. Semplice rielaborazione matematica di dati provenienti da dataset preesistenti – 2.3. Il particolare caso della mera validazione di dati – 2.4. Dataset realizzati attraverso un processo di modellazione di dati prelevati da un dataset preesistente – 2.5. Rappresentazione grafica del contenuto di un dataset.

--- Scarica la versione PDF di questo contenuto: da Zenodo; da SlideShare ---

________________________________________


1. I concetti di “derivazione” e “integrazione” nel mondo delle banche dati

1.1. Derivazione

Buona parte dei problemi in tema di licenziamento e riutilizzo di dati deriva dalle clausole che limitano/condizionano l’attività di realizzazione di database “derivati” (ne parleremo meglio quando tratteremo licenze come la Open Database License e le Creative Commons con clausola share alike).

Il concetto di “opera derivata” proviene infatti dal diritto d’autore classico, cioè il diritto d’autore applicato alle opere creative in senso pieno: tipici esempi di opere derivate sono la traduzione di un testo letterario, il remix di un brano musicale, l’adattamento cinematografico di un’opera teatrale. La realizzazione di una banca dati “nuova” partendo da una banca dati preesistente comporta un’attività diversa, che quindi, per essere correttamente inquadrata dal punto di vista giuridico, necessita di essere definita in modo molto preciso a livello contrattuale (appunto nelle licenze d’uso applicate).

Al contrario di quanto accade con le opere dell’ingegno tutelate dal diritto d’autore (comprese le banche dati con carattere creativo), per le quali si parla spesso di “derivazioni”, “elaborazioni creative” e “opere derivate”, non è chiaro se si possa applicare la categoria della derivazione ai database tutelati da mero diritto sui generis. Ciò è dovuto al fatto che tra i diritti esclusivi del costitutore di banca dati non vengono annoverati i diritti relativi alle classiche forme di derivazione e rielaborazione (come per esempio la traduzione, il riassunto, l’adattamento ad altro media, il riarrangiamento musicale); bensì, più propriamente, viene annoverato solo un diritto di impedire attività di estrazione e reimpiego di dati dal database (per la precisione di parti sostanziali del database).

1.2. Integrazione

Dobbiamo poi mettere a fuoco il concetto di integrazione tra database poiché in effetti “integrare” un database non creativo all’interno di un altro database non creativo è un’operazione diversa rispetto all’integrazione di due testi letterari o di due pacchetti software. Si tratta in sostanza di riversare i dati di un database all’interno di un altro autonomo database, rendendo le due masse di dati non più distinguibili, e lasciare che poi il database risultante venga diffuso, utilizzato, consultato come un “tutt’uno”. Ma non si ha una vera e propria “contaminazione” stilistica e creativa come appunto avviene con altri tipi di opere.

Non a caso, nel mondo dei database non creativi rilasciati, a volte il problema della compatibilità tra licenze si risolve tenendo i dataset separati e facendo in modo che l’utilizzatore possa interrogarli attraverso un’unica interfaccia software (realizzando così quella che nell’ambito software abbiamo chiamato “mera aggregazione”).

Per fare un esempio in metafora, integrare due dataset differenti è come miscelare due diversi tipi di cereali: da un lato abbiamo la confezione di fiocchi d’avena, dall’altro la confezione di riso soffiato, e li versiamo entrambi in un unico contenitore. Otteniamo così un mix che contiene sia fiocchi d’avena sia riso soffiato dal quale è difficile e poco pratico dividere di nuovo i due tipi cereali. Scriveremo sul contenitore “mix di fiocchi d’avena e riso soffiato”, che, seguendo sempre il senso della metafora, corrisponde alla classica avvertenza con i credits in cui indichiamo le due diverse fonti dei dati che sono state integrate in questo nuovo dataset derivato. Se però per qualche ragione contingente abbiamo necessità di poterli sempre separare anche a posteriori (per esempio, nostro figlio è intollerante ai fiocchi d’avena), non possiamo far altro che avere un contenitore che comunque abbia al suo interno due vaschette separate in cui da una parte possiamo mettere i fiocchi d’avena e dall’altra il riso soffiato. All’atto pratico, quando vorremo versare i cereali nella scodella, potremo comunque versarli insieme mescolandoli nella scodella; ma quando invece dovremo preparare la colazione per nostro figlio, potremo prendere solo i cereali dalla vaschetta del riso soffiato.

Uscendo dalla metafora, l’intolleranza di nostro figlio, che appunto ci obbliga a tenere separati i cereali anche se vengono conservati in un unico contenitore, corrisponde a una questione di incompatibilità tra i due database; incompatibilità che potrà essere derivante dalle rispettive licenze oppure dalla natura non omogenea dei dati.

2. Scenari più frequenti di integrazione e derivazione tra banche dati

2.1. Integrazione di dataset preesistenti

Come primo scenario poniamo quello in cui Tizio realizza il Dataset A con il numero dei casi di morbillo registrati nel 2015 in tutti i comuni della Provincia Autonoma di Bolzano. Caio realizza un autonomo Dataset B il numero dei casi di morbillo registrati nello stesso anno nei comuni della Provincia Autonoma di Trento. Sempronio vuole realizzare un Dataset C con il numero di tutti i casi registrati nel 2015 nella Regione Trentino-Alto Adige suddivisi per comuni e dunque può farlo semplicemente aggregando Dataset A e Dataset B in un più ampio Dataset C. In Dataset C i dati vengono riorganizzati secondo un criterio diverso. I due dataset originari perdono quindi i loro “confini” e si fondono in un nuovo e autonomo dataset.

Questa attività di integrazione fa sì che il Dataset C debba essere considerato come un dataset derivato contemporaneamente da Dataset A e da Dataset B. Di conseguenza Sempronio dovrà ottenere il permesso per l’attività di integrazione sia da Tizio sia da Caio; oppure, qualora i due dataset originari siano rilasciati con una licenza pubblica, dovrà verificare se le due licenze consentono quella specifica attività e se sono tra esse compatibili. Sempronio dovrà infatti rispettare sia le condizioni della licenza di Dataset A, sia le condizioni della licenza di Dataset B.

Diversa però sarebbe la situazione se Sempronio si limitasse a diffondere Dataset A e Dataset B in un unico file di archiviazione (tipo ZIP), mantenendoli tecnicamente separati e indicando per ciascuno la titolarità del copyright e la licenza applicata. In questo caso si verificherebbe quella che comunemente chiamiamo “mera aggregazione” e non saremmo di fronte a un’attività di derivazione/integrazione, dato che il file ZIP non costituisce un dataset a sé e Dataset A e Dataset B rimangono separati. Ovviamente anche in questo caso Sempronio dovrebbe ottenere da Tizio e da Caio un permesso anche per la sola ripubblicazione dei dataset originari (che è comunque un’attività riservata) o verificare se tale attività è consentita dalle rispettive licenze.

2.2. Semplice rielaborazione matematica di dati provenienti da dataset preesistenti

Tizio realizza il Dataset A con i livelli di polveri sottili registrati da apposite centraline posizionate in tutti i comuni d’Italia e che rilevano il dato ora per ora, ottenendo così 24 valori per ciascun comune. Caio utilizza i dati contenuti nel Dataset A per realizzare un Dataset B più semplificato che non fa altro che dare un valore medio giornaliero per ciascun comune, quindi da 24 valori per comune si passa a 1 valore per comune. Questo valore è ottenuto senza un’apprezzabile attività intellettuale bensì attraverso un banale calcolo matematico (una media), impostato automaticamente e scevro da un intervento intellettuale/creativo apprezzabile. Il Dataset B non contiene un’estrazione vera e propria dei valori del Dataset A perché nel Dataset B non si trovano valori presenti nel Dataset A, e dal Dataset B non è possibile risalire ai valori più dettagliati del Dataset A. Da un lato quindi verrebbe da pensare che il Dataset B non riproduce dati contenuti nel Dataset A; dall’altro lato tuttavia il Dataset B rappresenta comunque una forma di “reimpiego” di una parte sostanziale del dataset così come definito dall’art. 7, co. 2 dalla Direttiva 96/9/CE.

2.3. Il particolare caso della mera validazione di dati

Quello della mera validazione dei dati contenuti in un Dataset preesistente è uno scenario molto interessante e abbastanza ricorrente in ambito scientifico. Ipotizziamo che Tizio realizzi il Dataset A con il livello di pericolosità sismica di una determinata faglia in dinamica storica, con tutti gli eventi sismici registrati negli ultimi cento anni. Caio analizza i dati presenti in Dataset A per procedere a una loro validazione tecnico-scientifica basata sulla sua maggiore esperienza nel settore e sulla base di altri dati fondamentali (per esempio: le caratteristiche del terreno) e pubblica un Dataset A-bis sostanzialmente identico, ma validato; cioè senza alcun intervento sui dati ma solo con l’indicazione che il dataset è stato da lui validato. Oppure semplicemente nel Dataset A-bis Caio riporta una colonna aggiuntiva con l’indicazione dei dati validati e dei dati non validati.

È un caso giuridicamente interessante perché comunica efficacemente la differenza tra il diritto d’autore classico e il diritto sui generis sulle banche dati. Se parlassimo di un testo letterario o di un’opera musicale (cioè di opere tutelate da diritto d’autore), un intervento di validazione che non modifica l’opera in modo percepibile non potrebbe in alcun modo portare a un’opera derivata. Nel caso delle banche dati invece anche la mera attività di verifica di un database rientra nelle attività rilevanti ai fini della Direttiva 96/9/CE. L’art. 7, co. 1, precisa infatti che il costitutore di una banca dati non creativa è titolare del diritto sui generis “quando il conseguimento, la verifica e la presentazione del contenuto di una banca dati attestino un investimento rilevante sotto il profilo qualitativo o quantitativo”. A ben vedere, dunque, anche la semplice aggiunta di una colonna in una tabella di cento colonne rappresenta un’attività di reimpiego del dataset; attività che, benché possa risultare marginale a livello quantitativo, ha indubbiamente rilevanza sul piano qualitativo poiché va a modificare il concept generale del dataset, il suo valore e la sua possibilità di essere utilizzato da più utenti.

2.4. Dataset realizzati attraverso un processo di modellazione di dati prelevati da un dataset preesistente

Altro scenario abbastanza diffuso, che crea spesso fraintendimenti, è quello dell’attività di modellazione: mi riferisco ai modelli di previsione utilizzati per le previsioni meteo, per il calcolo del rischio sismico, per fornire proiezioni in finanza. Il modello è sostanzialmente un procedimento matematico che, a fronte di alcuni dati input, restituisce un output che appunto è la previsione/proiezione. Il modello quindi è più simile a software (opera tutelata dal diritto d’autore) e a un’espressione matematica (che teoricamente non potrebbe essere tutelata con diritto d’autore, ma più propriamente con l’applicazione del segreto industriale). A ogni modo, il modello è qualcosa di idealmente separato dai dati che esso “macina”, è un’opera dell’ingegno a sé stante. Ne consegue che il titolare dei diritti sul modello può essere un soggetto diverso da quello che realizza la banca dati da cui il modello estrae informazioni per fornire i suoi output. Ci si chiede quindi se vi sia un rapporto di derivazione tra i dataset input e il dataset prodotto dal modello come output; ma anche se vi sia un rapporto di derivazione tra i dataset input e il modello in sé. Lo focalizziamo meglio ponendo uno scenario ipotetico.

Tizio realizza il Dataset A con le temperature registrate in una determinata zona negli ultimi tre giorni; Caio realizza un autonomo Dataset B con il tasso di umidità registrato nella stessa zona negli ultimi tre giorni; Sempronio realizza un autonomo Dataset C con la pressione atmosferica registrata nella stessa zona negli ultimi tre giorni. Mevio, ha realizzato un modello di calcolo che incrocia i dati presenti nei Dataset A, B e C e permette di creare un Dataset Z con la probabilità di precipitazioni nelle prossime ore in quell’area.

Dataset Z dovrà essere considerato come dataset derivato dai Dataset A, B e C? La risposta è positiva. Il modello di calcolo può generare i suoi output e andare così a popolare il Dataset Z solo con un’attività di estrazione e reimpiego di parti sostanziali dei Dataset A, B e C. Ne consegue che colui che “fa girare il calcolo” e pubblica il Dataset Z dovrà avere ottenuto le adeguate autorizzazioni da parte dei titolari dei diritti dei Dataset input. In alternativa, i tre dataset di input dovranno essere rilasciati con licenze pubbliche che autorizzano quell’attività e dovranno inoltre essere tra loro compatibili; quindi il Dataset Z dovrà rispettare le indicazioni di titolarità dei diritti (c.d. attribution) di tutti i tre database input e la licenza scelta per il Dataset Z dovrà comunque essere compatibile con tutte e tre le licenze dei dataset di input.

2.5. Rappresentazione grafica del contenuto di un dataset

Altro scenario molto frequente è quello della rappresentazione grafica dei dati contenuti in una banca dati: grafici, tabelle, mappe e tutte le altre forme di data visualization.

Mostrare una mappa con dei dati presi da un dataset crea un rapporto di derivazione? Indubbiamente si tratta di un’attività di “estrazione e reimpiego”; tuttavia bisogna ricordare che la direttiva del 1996 parla più propriamente di “estrazione e reimpiego di parti sostanziali” di una banca dati. Quindi la risposta al quesito diventa necessariamente “dipende”, perché va parametrata sul concetto di “parte sostanziale”.

Benché sia più rara, si verifica anche la situazione opposta: utilizzare una mappa per estrarre informazioni e realizzare una banca dati. Una mappa non è una banca dati in sé bensì un’opera grafica tutelata da un diritto d’autore in senso classico; ma se si tratta di una mappa che riporta dei dati e se la raccolta di questi dati ha comportato per il suo autore un investimento rilevante, allora l’autore deterrà anche il famigerato diritto sui generis e potrà impedirne attività di estrazione e reimpiego dei dati. Anche in questo caso, comunque, per rispondere è necessario valutare se si tratti davvero di una parte sostanziale della banca dati.

Altra variabile interessante da valutare nella rappresentazione di dati su mappa è l’aspetto - per così dire - informatico. Una mappa contenente dati può essere diffusa online come file raster, ma può anche essere rappresentata come un file vettoriale composto da una serie di “strati” trasparenti che idealmente si “appoggiano” su una mappa neutra. Nel caso della mappa raster ha in effetti senso chiedersi se vi sia un rapporto di derivazione tra la mappa e il dataset originario da cui sono tratti i dati rappresentati nella mappa. Nel caso di una mappa “a strati” in realtà la questione va considerata in modo diverso, poiché non è la mappa in sé a rappresentare i dati bensì i vari strati trasparenti che ad essa si sovrappongono; e la mappa rimane solo di sfondo. In questo caso quindi, a seconda di come viene impostata l’interfaccia utente che mostra i dati sulla mappa, è possibile mantenere separati i vari dataset facendo corrispondere a ciascuno di essi uno strato di dati.

A complicare lo scenario intervengono anche i testi delle varie licenze d’uso per banche dati che, come vedremo, spesso contengono una definizione di “opera derivata” più precisa. In particolare vedremo nei prossimi paragrafi che la licenza OdbL (licenza open appositamente pensata per le banche dati) fa una distinzione tra Derivative Database e Produced Work, e dalle due diverse fattispecie fa dipendere diversi effetti giuridici. Come avremo modo di approfondire, il caso della realizzazione di una grafica o di una mappa basata sui dati di una banca dati rilasciata con licenza ODbL è proprio l’esempio più classico di Produced Work.