Scroll Top

Open data: ecco le basi di dati previste nel nuovo piano triennale di Agid

[:it]L’Agenzia per l’Italia Digitale (AGID) ha di recente completato il piano triennale relative all’elenco delle basi di dati da rilasciare in modalità “open”, in maniera standardizzata, interoperabile e nel rispetto di principi di qualità del dato.

Introduzione e contesto

Il dato e la sua gestione stanno acquisendo un ruolo sempre più centrale per la creazione del mercato unico digitale e lo sviluppo della cosiddetta “data-driven economy”. Le numerose iniziative, anche in ambito Europeo, legate al tema dei dati evidenziano inoltre come la disponibilità crescente di dati aperti, soprattutto del settore pubblico, sia un efficace volano per la creazione di servizi con un rilevante impatto sociale ed economico.

È idea consolidata che la maggior parte della vasta mole di dati gestita dalle pubbliche amministrazioni possa essere restituita alla collettività sotto forma di dati aperti, ovvero sotto forma di dati liberamente utilizzabili, modificabili e redistribuibili da chiunque per qualunque scopo. Tuttavia, sebbene il numero di dati aperti sia sempre maggiore, soprattutto in Italia imprese che intendono investire sul loro riutilizzo per lo sviluppo del proprio business lamentano ancora una scarsa qualità e una scarsa armonizzazione e standardizzazione dei dati, necessarie per effettuare correlazioni tra gli stessi e per studiare fenomeni complessi.

Rendere disponibili tutti questi dati, anche nel breve periodo, secondo il paradigma open data in maniera standardizzata, interoperabile e nel rispetto di principi di qualità del dato (come per esempio quelli indicati in standard di riferimento come l’ISO/IEC 25012) richiede comunque uno sforzo importante delle amministrazioni, in particolare in termini di revisione degli attuali processi di gestione del dato con conseguente impatto sui costi e sulle risorse richieste, che potrebbero anche dover avere competenze diverse rispetto al passato.

In questo scenario, è cruciale definire un’opportuna politica nazionale che accompagni le amministrazioni in un percorso virtuoso di gestione del dato, inteso come bene comune e quindi da condividere con la collettività. Il primo passo da compiere nel percorso riguarda l’individuazione di basi di dati chiave da valorizzare per rispondere a bisogni della collettività, rendendole disponibili sotto forma di open data, facilmente ottenibili “in bulk” e/o interrogabili attraverso Application Programming Interface (API) e descritte sia a livello di metadatazione generale che a livello di dati con chiari modelli condivisi, allineati ad altri già esistenti a livello Europeo e nel Web.

Nota

In questo documento definiamo basi di dati chiave quelle basi di dati /dataset di particolare interesse per la collettività, che concorrono a descrivere fenomeni in maniera standardizzata a livello nazionale e la cui disponibilità secondo il paradigma dell’open data assume pertanto rilevanza nazionale. In alcuni casi, esse possono coincidere con le basi di dati di interesse nazionale già individuate nel piano triennale per l’informatica nella PA 2017-2019 (e.g., anagrafe nazionale delle strade urbane e dei numeri civici), o con parti di esse (e.g., le statistiche del registro imprese). Tenuto conto della loro rilevanza, e quindi del potenziale impatto del loro riutilizzo sulla società, la gestione delle basi di dati chiave sarà governata secondo principi stringenti di accountability: i dati saranno costantemente e strettamente monitorati dandone chiara evidenza alle amministrazioni coinvolte nella loro apertura.

Nel 2017 alcune iniziative di rilievo hanno individuato dataset e basi di dati da rilasciare come dati aperti secondo i piani di rilascio di diverse amministrazioni pubbliche coinvolte nelle iniziative. Quest’ultime sono riportate nella figura sottostante.

Figura 1:Iniziative di individuazione di dataset e basi di dati da rendere disponibili come open data

Figura 1: Iniziative di individuazione di dataset e basi di dati da rendere disponibili come open data

Nell’ambito dell’Open Government Partnership (OGP) si è individuato un primo elenco piuttosto vasto di basi di dati e dataset per il periodo di riferimento 2017-2018. Il risultato è stato ottenuto mediante l’invio a un gruppo di circa venti amministrazioni, locali e centrali, di un apposito questionario.

Il paniere dinamico di dataset, incluso nel Piano Triennale per l’Informatica nella PA (2017-2019), rappresenta invece un sottoinsieme dell’elenco prodotto nell’ambito della relativa azione OGP; esso è lo strumento in base al quale viene calcolato l’indicatore previsto dall’Accordo di Partenariato 2014-2020 ed è il risultato di un lavoro sviluppato secondo una metodologia documentata nel Rapporto Annuale sulla Disponibilità di banche dati pubbliche in formato aperto – anno 2016 che ha portato alla definizione di dataset da rendere disponibili come open data nel periodo 2016-2018, sia a livello nazionale che a livello regionale. La loro apertura sarà monitorata nel corso dei tre anni di riferimento.

Nota

Questo documento mira a restringere ulteriormente l’elenco fornito dal paniere dinamico a un insieme di basi di dati chiave/dataset chiave, individuati anche sulla base di richieste pervenute dalla collettività, che nel corso del 2017 seguiranno un percorso specifico di monitoraggio e qualità (si veda la Sezione Obiettivi) funzionali ad aumentarne la fruibilità e il riutilizzo da parte di chiunque e per qualunque scopo.

Figura 2: Seconda azione open data del piano triennale per l'informatica nella PA

Figura 2: Seconda azione open data del piano triennale per l’informatica nella PA.

Processo di individuazione delle basi di dati chiave

Il processo di individuazione delle basi di dati chiave di questo documento si è sviluppato grazie al lavoro congiunto sul tema dei dati aperti del Team per la Trasformazione Digitale (di seguito Team Digitale) e dell’Agenzia per l’Italia Digitale (AgID). In particolare, il processo si è avviato principalmente nell’ambito di una task force istituita e coordinata dal Team Digitale e l’AgID. La task force, chiamata “#DatiPubblici Task Force”, è composta da amministrazioni locali, sia regionali che comunali, particolarmente attive da diversi anni nell’ambito open data. L’Appendice I elenca le amministrazioni coinvolte nella task force).

Ulteriori basi di dati chiave sono state individuate anche attraverso collaborazioni dirette con un insieme ristretto di amministrazioni centrali (principalmente Ministeri e Agenzie) nel contesto dello sviluppo del Data & Analytics Framework (DAF).

Figura 3: Individuazione basi di dati chiave: governance

Figura 3: Individuazione basi di dati chiave: governance

Il processo ha prima identificato macro ambiti di riferimento (o domini) e in seguito, all’interno di questi, le basi di dati chiave. La scelta dei macro ambiti e delle relative basi di dati chiave è avvenuta tenendo conto dei seguenti fattori:

  • specifiche richieste di tipologie di dati da parte della collettività, anche pervenute in contesti come l’OGP e in precedenti consultazioni pubbliche dell’AgID;
  • disponibilità di modelli di dati già predisposti dalle amministrazioni;
  • supporto a specifiche politiche di sviluppo nazionali (e.g., piano strategico del turismo) e a iniziative internazionali (e.g., OGP);
  • predisposizione per lo studio di fenomeni complessi su scala nazionale;
  • disponibilità dei dati da parte dei relativi titolari per l’apertura secondo tutti i principi cardine dell’open data (i.e., download in bulk, gratuità, formato aperto machine-readable, licenza aperta, minor aggregazione possibile).

Elenco basi di dati chiave

In base ai fattori precedentemente discussi, si sono individuati cinque macro ambiti di riferimento per le basi di dati chiave/dataset chiave del 2017; gli ambiti sono di seguito riportati utilizzando le denominazioni del vocabolario dei temi per i dati del profilo di metadatazione nazionale DCAT-AP_IT:

  1. Trasporti (che include anche dati relativi in generale alla mobilità);
  2. Istruzione, cultura e sport (che include anche il turismo);
  3. Economia e finanze;
  4. Giustizia, sistema giuridico e sicurezza pubblica;
  5. Regioni e città.

Per ciascuno di questi ambiti, la seguente tabella elenca sia le basi di dati chiave / dataset chiave individuati, sia gli enti coinvolti nella loro apertura. Si noti che, nel caso del coinvolgimento della task force #DatiPubblici, non necessariamente tutte le amministrazioni della stessa concorreranno nel corso del 2017 ugualmente e direttamente nel rilascio dei relativi dati in open data. Questo dipende da diversi fattori tra cui la reale disponibilità dei dati presso le amministrazioni e la titolarità degli stessi. (e.g., i dati sugli incidenti stradali sono originati a livello di singoli comuni). Tuttavia, si sottolinea che: (i) alcuni dataset di seguito riportati sono stati scelti anche in base alla loro disponibilità presso più di una amministrazione così da abilitare successivamente analisi standardizzate per diversi stakeholder a livello nazionale; (ii) gli organi di coordinamento della task force lavoreranno per supportare le amministrazioni nella raccolta, gestione e pubblicazione dei dati secondo i principi dell’open data.

Trasporti

Base di dati / dataset Enti coinvolti apertura Descrizione
Traffico e viabilità
in tempo reale
Task Force
#DatiPubblici
Il dataset contiene i dati relativi allo stato,
gli eventi e alle telecamere di monitoraggio
del traffico e della viabilità in tempo reale.
Parcheggi
Task Force
#DatiPubblici
Il dataset contiene i dati sulla posizione
e lo stato dei parcheggi
Perimetro, varchi
e orari ZTL
Task Force
#DatiPubblici
Il dataset contiene la descrizione geometrica del
perimetro della ZTL gli orari e i varchi di accesso.
Trasporto Pubblico locale
dati statici
e in tempo reale
Task Force
#DatiPubblici
I dataset contengono i dati statici del trasporto pubblico
locale quali fermate, tratti e orari degli autobus,
e i dati in tempo reale del trasporto pubblico locale.
Patenti Attive MIT – Motorizzazione Il dataset contiene i dati sulle patenti attive in Italia.
Incidenti Stradali
Task Force
#DatiPubblici
Il dataset contiene i dati sugli incidenti stradali
rilevati dalle polizie municipali dei territori comunali.

Istruzione cultura e sport

Base di dati / dataset Enti coinvolti apertura Descrizione
Istituti e Luoghi
della Cultura
MIBACT e Task Force
#DatiPubblici
Dataset contenente i dati relativi agli istituti e luoghi
della cultura (biblioteche, musei, parchi archeologici, ecc.)
I dati descrivono le sedi, gli enti competenti sui luoghi,
i servizi offerti e le informazioni di accesso ai luoghi.
Eventi culturali
MIBACT e Task Force
#DatiPubblici
Dataset contenenti gli eventi culturali che si tengono
all’interno dei luoghi della cultura.
Catalogo generale
dei beni culturali
MIBACT e Task Force
#DatiPubblici
Basi di dati sulle schede di catalogo dei beni culturali
elaborati nel Sistema generale del Catalogo (SIGEC).
Cammini e percorsi
MIBACT, Regioni Task Force
#DatiPubblicii e altre
Regioniindividuate dal MIBACT
Base di dati contenente informazioni su itinerari e percorsi
(e.g., via francigena). I percorsi e gli itinerari sono
descritti in base al tipo di percorso, alle possibili tappe,
ai territori attraversati, ecc.
Strutture ricettive
MIBACT, Regioni Task Force
#DatiPubblicii e altre
Regioni individuate dal MIBACT
Base di dati contenente i dati relativi alle informazioni
principali che consentono di identificare le strutture
ricettive quali agriturismi, strutture alberghiere e strutture
extra alberghiere.
Guide Turistiche
MIBACT, Regioni Task Force
#DatiPubblicii e altre
Regioni individuate dal MIBACT
Base di dati contenente le principali informazioni sulle
guide turistiche d’Italia.

Economia e finanze

Base di dati / dataset Enti coinvolti apertura Descrizione
Anagrafica Startup
PMI innovative e
incubatori certificati
Infocamere
Il dataset contiene i dati sulle anagrafiche (denominazione,
codice fiscale, sito web, settore, data inizio attività, ecc.)
delle Startup, PMI innovative e incubatori certificati.
Statistiche Startup
PMI innovative e
incubatori certificati
Infocamere
I dataset contengono i dati sulle statistiche delle Startup,
PMI innovative e incubatori certificati come pubblicati sul
relativo sito.
Statistiche del registro
imprese – Movimprese
Infocamere
Il dataset contiene i dati Movimprese ovvero l’analisi
statistica trimestrale della nati-mortalità delle imprese
condotta da InfoCamere, per conto di UnionCamere sugli archivi
di tutte le Camere di Commercio italiane.
Catasto – Osservatorio
Mercato Immobiliare
Agenzia delle Entrate
Base di dati relativa all’osservatorio del mercato immobiliare
contenente informazioni di carattere tecnico-economico
relative ai valori immobiliari, al mercato degli affitti
e ai tassi di rendita.
Catasto – Consultazione
Rendite
Agenzia delle Entrate
Basi di dati contenente i dati relativi alla rendita di
qualsiasi immobile censito nel Catasto dei fabbricati e quelli
relativi ai redditi dominicale e agrario per qualsiasi
immobile censito nel Catasto dei terreni.

Giustizia, sistema giuridico e sicurezza pubblica

Base di dati / dataset Enti coinvolti apertura Descrizione
Normattiva
Istituto Poligrafico e
Zecca dello Stato
Basi di dati delle leggi italiane.

Regioni e città

Base di dati / dataset Enti coinvolti apertura Descrizione
Catasto – Archivio
storico dei comuni
Agenzia delle Entrate
Base di dati contenente l’evoluzione storica dei Comuni
d’Italia con gli associati codici belfiore (utilizzati
nell’anagrafe della popolazione residente e per il rilascio
del codice fiscale).
ANNCSU – Anagrafe
Nazionale Numeri Civici
e Strade Urbane
Agenzia delle Entrate
e ISTAT
Basi di dati di interesse nazionale che contiene le strade
urbane e i numeri civici georeferiti e validati dai Comuni.

Obiettivi

Per ciascuna base di dati / dataset chiave individuata in Sezione Elenco basi di dati chiave si identificano i seguenti obiettivi da raggiungere nel corso del 2017.

Nota

Obiettivo 1: Al fine di valorizzare i dati identificati, essi saranno “ingestionati” all’interno del Data & Analytics Framework (DAF).

Per raggiungere questo obiettivo, AgID e il Team Digitale:

  • coordineranno le attività di contatto con le amministrazioni coinvolte nelle basi di dati, come precedentemente individuate;
  • individueranno i meccanismi necessari per l’interfacciamento tra le basi di dati e il DAF;
  • effettueranno l’ingestione dei dati nel DAF.

Nota

Obiettivo 2: Attraverso il DAF, i dati saranno resi disponibili secondo il paradigma open data.

Ove i dati non siano ancora stati resi disponibili come open data da parte degli enti coinvolti ed elencati in Sezione Elenco basi di dati chiave, essi saranno:

  • resi disponibili gratuitamente;
  • liberamente accessibili mediante download in bulk e mediante API, senza richieste specifiche di autenticazione per l’accesso ai dati;
  • in formato aperto machine-readable;
  • resi disponibili secondo i termini della licenza raccomandata nelle linee guida per la valorizzazione del patrimonio informativo pubblico;
  • inclusi nel catalogo nazionale dei dati.

Nota

Obiettivo 3: I dati saranno corredati di API per consentire una loro diretta interrogazione.

Le API saranno rese disponibili secondo quanto previsto dal nuovo “modello di interoperabilità”descritto nel Piano Triennale per l’Informatica nella PA (2017-2019).

Nota

Obiettivo 4: I dati saranno descritti secondo modelli/ontologie e vocabolari controllati condivisi, ove possibile allineati con altri esistenti a livello europeo e nel Web. I metadati generali associati ai dati seguiranno le specifiche del profilo di metadazione DCAT-AP_IT.

Per raggiungere questo obiettivo:

  • alcuni modelli/ontologie e vocabolari controllati saranno creati appositamente;
  • i modelli/ontologie creati e quelli già esistenti che possono essere riutilizzati saranno resi disponibili mediante apposito registro da sviluppare, come indicato nel piano triennale per l’informatica nelal PA 2017-2019.

Nota

Obiettivo 5: Attraverso il DAF, i dati saranno costantemente monitorati in collaborazione con le amministrazioni coinvolte nella loro apertura.

Grazie a specifiche funzionalità del DAF:

  • saranno individuati indicatori per misurare la loro qualità, incluso il loro costante aggiornamento nel tempo;
  • saranno monitorati possibili riutilizzi dei dati stessi da parte della collettività.

[:]