Perché i dati ministeriali sull'epidemia COVID-19 non sono davvero open data

In questi giorni alcuni attivisti del mondo open data e più specificamente nell'ambito del riuso dei dati pubblici relativi all'emergenza COVID-19 hanno sollevato il problema della poca "apertura" dei dati forniti dal Ministero della Salute, lanciando la petizione #DatiBeneComune.

Sul sito dell'iniziativa (https://datibenecomune.it/) si legge una lettera aperta alle istituzioni con la quale si chiedono cinque specifici interventi nella direzione di una piena apertura dei dati sulla pandemia raccolti e gestiti dal settore pubblico (la cosiddetta public sector information). Riporto i cinque interventi in calce a questo post. Ma in questa sede mi interessa più che altro soffermarmi sull'aspetto che ritengo maggiormente di mia competenza: quello delle licenze d'uso.

Il portale del Ministero dedicato all'emergenza COVID-19 ha in effetti una pagina "note legali" che contiene alcuni riferimenti alle licenze d'uso e che merita qualche commento.

La licenza scelta è una Creative Commons Attribuzione - Non commerciale - Non opere derivate, cioè la più restrittiva tra le sei opzioni offerte da Creative Commons e senza dubbio non conforme a tutte le più accreditate definizione di "open". In altre parole, un contenuto rilasciato con quella licenza non è davvero "aperto" perché permangono una serie di restrizioni come il divieto di utilizzi commerciali e il divieto di farne opere derivate e rielaborazioni, che per altro sembrano non così necessarie su dati pubblici (raccolti con fondi pubblici e raccolti sulla base di una specifica mission istituzionale e non per libera scelta "strategica" di una pubblica amministrazione).

Altro problema: in quel paragrafo i link alla licenza Creative Commons sono due, e aprendoli ci si accorge che in realtà rimandano a due diverse versioni della licenza: il primo a una versione 3.0 unported il secondo a una 2.5 Italia. La differenza non è di pura lana caprina bensì sostanziale, specialmente se applicate ai dati. Quindi ciò può creare discrepanze interpretative su quale sia davvero la volontà del licenziante/titolare dei diritti e quali siano le condizioni che gli utilizzatori devono effettivamente rispettare.

Infine, si noti che, per espressa previsione della pagina "note legali", la licenza si intende applicata ai testi e ai dati ma restano escluse le immagini, la cui riproduzione è condizionata "all'approvazione scritta del ministero", rendendo ulteriormente limitato e vincolato il riutilizzo dei documenti che necessariamente contengono anche immagini (pensiamo a grafici e infografiche). Tutto il discorso ovviamente vale se si dà per acquisito che si tratti di dati aggregati e anonimizzati (come mi auspico sia), per i quali quindi non si pongono problemi di gestione/tutela della privacy.

E fin qui mi sono limitato appunto all'aspetto legale. L'openness di un dato però dipende anche da aspetti di natura tecnologica e ontologica. Su questo aspetto però lascio volentieri la parola a persone più esperte di me.

_________________________


I CINQUE INTERVENTI RICHIESTI DA DATIBENECOMUNE.IT

  • rendere disponibili, aperti, interoperabili (machine readable) e disaggregati tutti i dati comunicati dalle Regioni al Governo dall'inizio dell'epidemia per monitorare e classificare il rischio epidemico (compresi tutti gli indicatori di processo sulla capacità di monitoraggio, di accertamento e quelli di risultato). Fare lo stesso per tutti i dati che alimentano i bollettini con dettaglio regionale, provinciale e comunale, della cosiddetta Sorveglianza integrata COVID-19 dell'Istituto Superiore di Sanità e i dati relativi ai contagi all’interno dei sistemi, in particolar modo scolastici. Tutti i dati devono riportare la data di trasmissione e aggiornamento;
  • rendere pubbliche le evidenze scientifiche, le formule e gli algoritmi, che mettono in correlazione la valutazione del rischio, le misure restrittive e l’impatto epidemiologico ad esso correlato;
  • recepire nella gestione, pubblicazione e descrizione dei dati tutte le raccomandazioni della task force “Gruppo di lavoro 2 – Data collection and Infrastructure“, presenti nel documento “Analisi dei flussi e mappatura delle banche dati di interesse per la task force dati per l’emergenza COVID-19”;
  • nominare un/a referente COVID-19 su dati e trasparenza e un/a referente per ogni regione, a cui la società civile possa fare riferimento;
  • istituire un centro nazionale, in rete con omologhi centri regionali, dedicato ai dati Covid, che non solo imponga standard e formati, ma che coordini e integri nuovi sistemi di raccolta e individui le criticità in quelli esistenti.


Commenti

Stefano ha detto…
Desidero congratularmi per l'ottimo post. Da tempo mi ero ripromesso di leggere i suoi lavori e, trovando finalmente un po' di tempo, sono venuto ad aggiornarmi sul suo sito. Sono un sostenitore della petizione #datibenecomune. Forse già sarà a conoscenza dell'articolo pubblicato su Wired qualche giorno fa, riguardante l'emendamento alla legge di bilancio, depositato alla Camera da Fusacchia, Rossini, Carabetta, e altri 25 deputati, che chiede l'introduzione di un sistema di raccolta e pubblicazione dei dati in formato aperto e trasparente. Ad ogni buon conto inoltro qui sotto il link
https://www.wired.it/attualita/politica/2020/11/30/emendamento-dati-aperti-covid-19/?refresh_ce=
Un cordiale saluto
Stefano