[:it]L’Agenzia per l’Italia Digitale (AGID) ha di recente completato il piano triennale relative all’elenco delle basi di dati da rilasciare in modalità “open”, in maniera standardizzata, interoperabile e nel rispetto di principi di qualità del dato.
Introduzione e contesto
Il dato e la sua gestione stanno acquisendo un ruolo sempre più centrale per la creazione del mercato unico digitale e lo sviluppo della cosiddetta “data-driven economy”. Le numerose iniziative, anche in ambito Europeo, legate al tema dei dati evidenziano inoltre come la disponibilità crescente di dati aperti, soprattutto del settore pubblico, sia un efficace volano per la creazione di servizi con un rilevante impatto sociale ed economico.
È idea consolidata che la maggior parte della vasta mole di dati gestita dalle pubbliche amministrazioni possa essere restituita alla collettività sotto forma di dati aperti, ovvero sotto forma di dati liberamente utilizzabili, modificabili e redistribuibili da chiunque per qualunque scopo. Tuttavia, sebbene il numero di dati aperti sia sempre maggiore, soprattutto in Italia imprese che intendono investire sul loro riutilizzo per lo sviluppo del proprio business lamentano ancora una scarsa qualità e una scarsa armonizzazione e standardizzazione dei dati, necessarie per effettuare correlazioni tra gli stessi e per studiare fenomeni complessi.
Rendere disponibili tutti questi dati, anche nel breve periodo, secondo il paradigma open data in maniera standardizzata, interoperabile e nel rispetto di principi di qualità del dato (come per esempio quelli indicati in standard di riferimento come l’ISO/IEC 25012) richiede comunque uno sforzo importante delle amministrazioni, in particolare in termini di revisione degli attuali processi di gestione del dato con conseguente impatto sui costi e sulle risorse richieste, che potrebbero anche dover avere competenze diverse rispetto al passato.
In questo scenario, è cruciale definire un’opportuna politica nazionale che accompagni le amministrazioni in un percorso virtuoso di gestione del dato, inteso come bene comune e quindi da condividere con la collettività. Il primo passo da compiere nel percorso riguarda l’individuazione di basi di dati chiave da valorizzare per rispondere a bisogni della collettività, rendendole disponibili sotto forma di open data, facilmente ottenibili “in bulk” e/o interrogabili attraverso Application Programming Interface (API) e descritte sia a livello di metadatazione generale che a livello di dati con chiari modelli condivisi, allineati ad altri già esistenti a livello Europeo e nel Web.
Nota
In questo documento definiamo basi di dati chiave quelle basi di dati /dataset di particolare interesse per la collettività, che concorrono a descrivere fenomeni in maniera standardizzata a livello nazionale e la cui disponibilità secondo il paradigma dell’open data assume pertanto rilevanza nazionale. In alcuni casi, esse possono coincidere con le basi di dati di interesse nazionale già individuate nel piano triennale per l’informatica nella PA 2017-2019 (e.g., anagrafe nazionale delle strade urbane e dei numeri civici), o con parti di esse (e.g., le statistiche del registro imprese). Tenuto conto della loro rilevanza, e quindi del potenziale impatto del loro riutilizzo sulla società, la gestione delle basi di dati chiave sarà governata secondo principi stringenti di accountability: i dati saranno costantemente e strettamente monitorati dandone chiara evidenza alle amministrazioni coinvolte nella loro apertura.
Nel 2017 alcune iniziative di rilievo hanno individuato dataset e basi di dati da rilasciare come dati aperti secondo i piani di rilascio di diverse amministrazioni pubbliche coinvolte nelle iniziative. Quest’ultime sono riportate nella figura sottostante.
Nell’ambito dell’Open Government Partnership (OGP) si è individuato un primo elenco piuttosto vasto di basi di dati e dataset per il periodo di riferimento 2017-2018. Il risultato è stato ottenuto mediante l’invio a un gruppo di circa venti amministrazioni, locali e centrali, di un apposito questionario.
Il paniere dinamico di dataset, incluso nel Piano Triennale per l’Informatica nella PA (2017-2019), rappresenta invece un sottoinsieme dell’elenco prodotto nell’ambito della relativa azione OGP; esso è lo strumento in base al quale viene calcolato l’indicatore previsto dall’Accordo di Partenariato 2014-2020 ed è il risultato di un lavoro sviluppato secondo una metodologia documentata nel Rapporto Annuale sulla Disponibilità di banche dati pubbliche in formato aperto – anno 2016 che ha portato alla definizione di dataset da rendere disponibili come open data nel periodo 2016-2018, sia a livello nazionale che a livello regionale. La loro apertura sarà monitorata nel corso dei tre anni di riferimento.
Nota
Questo documento mira a restringere ulteriormente l’elenco fornito dal paniere dinamico a un insieme di basi di dati chiave/dataset chiave, individuati anche sulla base di richieste pervenute dalla collettività, che nel corso del 2017 seguiranno un percorso specifico di monitoraggio e qualità (si veda la Sezione Obiettivi) funzionali ad aumentarne la fruibilità e il riutilizzo da parte di chiunque e per qualunque scopo.
Processo di individuazione delle basi di dati chiave
Il processo di individuazione delle basi di dati chiave di questo documento si è sviluppato grazie al lavoro congiunto sul tema dei dati aperti del Team per la Trasformazione Digitale (di seguito Team Digitale) e dell’Agenzia per l’Italia Digitale (AgID). In particolare, il processo si è avviato principalmente nell’ambito di una task force istituita e coordinata dal Team Digitale e l’AgID. La task force, chiamata “#DatiPubblici Task Force”, è composta da amministrazioni locali, sia regionali che comunali, particolarmente attive da diversi anni nell’ambito open data. L’Appendice I elenca le amministrazioni coinvolte nella task force).
Ulteriori basi di dati chiave sono state individuate anche attraverso collaborazioni dirette con un insieme ristretto di amministrazioni centrali (principalmente Ministeri e Agenzie) nel contesto dello sviluppo del Data & Analytics Framework (DAF).
Il processo ha prima identificato macro ambiti di riferimento (o domini) e in seguito, all’interno di questi, le basi di dati chiave. La scelta dei macro ambiti e delle relative basi di dati chiave è avvenuta tenendo conto dei seguenti fattori:
- specifiche richieste di tipologie di dati da parte della collettività, anche pervenute in contesti come l’OGP e in precedenti consultazioni pubbliche dell’AgID;
- disponibilità di modelli di dati già predisposti dalle amministrazioni;
- supporto a specifiche politiche di sviluppo nazionali (e.g., piano strategico del turismo) e a iniziative internazionali (e.g., OGP);
- predisposizione per lo studio di fenomeni complessi su scala nazionale;
- disponibilità dei dati da parte dei relativi titolari per l’apertura secondo tutti i principi cardine dell’open data (i.e., download in bulk, gratuità, formato aperto machine-readable, licenza aperta, minor aggregazione possibile).
Elenco basi di dati chiave
In base ai fattori precedentemente discussi, si sono individuati cinque macro ambiti di riferimento per le basi di dati chiave/dataset chiave del 2017; gli ambiti sono di seguito riportati utilizzando le denominazioni del vocabolario dei temi per i dati del profilo di metadatazione nazionale DCAT-AP_IT:
- Trasporti (che include anche dati relativi in generale alla mobilità);
- Istruzione, cultura e sport (che include anche il turismo);
- Economia e finanze;
- Giustizia, sistema giuridico e sicurezza pubblica;
- Regioni e città.
Per ciascuno di questi ambiti, la seguente tabella elenca sia le basi di dati chiave / dataset chiave individuati, sia gli enti coinvolti nella loro apertura. Si noti che, nel caso del coinvolgimento della task force #DatiPubblici, non necessariamente tutte le amministrazioni della stessa concorreranno nel corso del 2017 ugualmente e direttamente nel rilascio dei relativi dati in open data. Questo dipende da diversi fattori tra cui la reale disponibilità dei dati presso le amministrazioni e la titolarità degli stessi. (e.g., i dati sugli incidenti stradali sono originati a livello di singoli comuni). Tuttavia, si sottolinea che: (i) alcuni dataset di seguito riportati sono stati scelti anche in base alla loro disponibilità presso più di una amministrazione così da abilitare successivamente analisi standardizzate per diversi stakeholder a livello nazionale; (ii) gli organi di coordinamento della task force lavoreranno per supportare le amministrazioni nella raccolta, gestione e pubblicazione dei dati secondo i principi dell’open data.
Base di dati / dataset Enti coinvolti apertura Descrizione Traffico e viabilitàin tempo reale Task Force#DatiPubblici Il dataset contiene i dati relativi allo stato,gli eventi e alle telecamere di monitoraggiodel traffico e della viabilità in tempo reale.Parcheggi Task Force#DatiPubblici Il dataset contiene i dati sulla posizionee lo stato dei parcheggi Perimetro, varchie orari ZTL Task Force#DatiPubblici Il dataset contiene la descrizione geometrica delperimetro della ZTL gli orari e i varchi di accesso. Trasporto Pubblico localedati staticie in tempo reale Task Force#DatiPubblici I dataset contengono i dati statici del trasporto pubblicolocale quali fermate, tratti e orari degli autobus,e i dati in tempo reale del trasporto pubblico locale.Patenti Attive MIT – Motorizzazione Il dataset contiene i dati sulle patenti attive in Italia. Incidenti Stradali Task Force#DatiPubblici Il dataset contiene i dati sugli incidenti stradalirilevati dalle polizie municipali dei territori comunali.
Base di dati / dataset Enti coinvolti apertura Descrizione Istituti e Luoghidella Cultura MIBACT e Task Force#DatiPubblici Dataset contenente i dati relativi agli istituti e luoghidella cultura (biblioteche, musei, parchi archeologici, ecc.)I dati descrivono le sedi, gli enti competenti sui luoghi,i servizi offerti e le informazioni di accesso ai luoghi.Eventi culturali MIBACT e Task Force#DatiPubblici Dataset contenenti gli eventi culturali che si tengonoall’interno dei luoghi della cultura. Catalogo generaledei beni culturali MIBACT e Task Force#DatiPubblici Basi di dati sulle schede di catalogo dei beni culturalielaborati nel Sistema generale del Catalogo (SIGEC).Cammini e percorsi MIBACT, Regioni Task Force#DatiPubblicii e altreRegioniindividuate dal MIBACT Base di dati contenente informazioni su itinerari e percorsi(e.g., via francigena). I percorsi e gli itinerari sonodescritti in base al tipo di percorso, alle possibili tappe,ai territori attraversati, ecc.Strutture ricettive MIBACT, Regioni Task Force#DatiPubblicii e altreRegioni individuate dal MIBACT Base di dati contenente i dati relativi alle informazioniprincipali che consentono di identificare le strutturericettive quali agriturismi, strutture alberghiere e struttureextra alberghiere.Guide Turistiche MIBACT, Regioni Task Force#DatiPubblicii e altreRegioni individuate dal MIBACT Base di dati contenente le principali informazioni sulleguide turistiche d’Italia.
Base di dati / dataset Enti coinvolti apertura Descrizione Anagrafica StartupPMI innovative eincubatori certificatiInfocamere Il dataset contiene i dati sulle anagrafiche (denominazione,codice fiscale, sito web, settore, data inizio attività, ecc.)delle Startup, PMI innovative e incubatori certificati. Statistiche StartupPMI innovative eincubatori certificatiInfocamere I dataset contengono i dati sulle statistiche delle Startup,PMI innovative e incubatori certificati come pubblicati sulrelativo sito. Statistiche del registroimprese – MovimpreseInfocamere Il dataset contiene i dati Movimprese ovvero l’analisistatistica trimestrale della nati-mortalità delle impresecondotta da InfoCamere, per conto di UnionCamere sugli archividi tutte le Camere di Commercio italiane. Catasto – OsservatorioMercato ImmobiliareAgenzia delle Entrate Base di dati relativa all’osservatorio del mercato immobiliarecontenente informazioni di carattere tecnico-economicorelative ai valori immobiliari, al mercato degli affittie ai tassi di rendita. Catasto – ConsultazioneRenditeAgenzia delle Entrate Basi di dati contenente i dati relativi alla rendita diqualsiasi immobile censito nel Catasto dei fabbricati e quellirelativi ai redditi dominicale e agrario per qualsiasiimmobile censito nel Catasto dei terreni.Giustizia, sistema giuridico e sicurezza pubblica
Base di dati / dataset Enti coinvolti apertura Descrizione Normattiva Istituto Poligrafico eZecca dello StatoBasi di dati delle leggi italiane.
Base di dati / dataset Enti coinvolti apertura Descrizione Catasto – Archiviostorico dei comuniAgenzia delle Entrate Base di dati contenente l’evoluzione storica dei Comunid’Italia con gli associati codici belfiore (utilizzatinell’anagrafe della popolazione residente e per il rilasciodel codice fiscale). ANNCSU – AnagrafeNazionale Numeri Civicie Strade Urbane Agenzia delle Entratee ISTAT Basi di dati di interesse nazionale che contiene le stradeurbane e i numeri civici georeferiti e validati dai Comuni.Obiettivi
Per ciascuna base di dati / dataset chiave individuata in Sezione Elenco basi di dati chiave si identificano i seguenti obiettivi da raggiungere nel corso del 2017.
Nota
Obiettivo 1: Al fine di valorizzare i dati identificati, essi saranno “ingestionati” all’interno del Data & Analytics Framework (DAF).
Per raggiungere questo obiettivo, AgID e il Team Digitale:
- coordineranno le attività di contatto con le amministrazioni coinvolte nelle basi di dati, come precedentemente individuate;
- individueranno i meccanismi necessari per l’interfacciamento tra le basi di dati e il DAF;
- effettueranno l’ingestione dei dati nel DAF.
Nota
Obiettivo 2: Attraverso il DAF, i dati saranno resi disponibili secondo il paradigma open data.
Ove i dati non siano ancora stati resi disponibili come open data da parte degli enti coinvolti ed elencati in Sezione Elenco basi di dati chiave, essi saranno:
- resi disponibili gratuitamente;
- liberamente accessibili mediante download in bulk e mediante API, senza richieste specifiche di autenticazione per l’accesso ai dati;
- in formato aperto machine-readable;
- resi disponibili secondo i termini della licenza raccomandata nelle linee guida per la valorizzazione del patrimonio informativo pubblico;
- inclusi nel catalogo nazionale dei dati.
Nota
Obiettivo 3: I dati saranno corredati di API per consentire una loro diretta interrogazione.
Le API saranno rese disponibili secondo quanto previsto dal nuovo “modello di interoperabilità”descritto nel Piano Triennale per l’Informatica nella PA (2017-2019).
Nota
Obiettivo 4: I dati saranno descritti secondo modelli/ontologie e vocabolari controllati condivisi, ove possibile allineati con altri esistenti a livello europeo e nel Web. I metadati generali associati ai dati seguiranno le specifiche del profilo di metadazione DCAT-AP_IT.
Per raggiungere questo obiettivo:
- alcuni modelli/ontologie e vocabolari controllati saranno creati appositamente;
- i modelli/ontologie creati e quelli già esistenti che possono essere riutilizzati saranno resi disponibili mediante apposito registro da sviluppare, come indicato nel piano triennale per l’informatica nelal PA 2017-2019.
Nota
Obiettivo 5: Attraverso il DAF, i dati saranno costantemente monitorati in collaborazione con le amministrazioni coinvolte nella loro apertura.
Grazie a specifiche funzionalità del DAF:
- saranno individuati indicatori per misurare la loro qualità, incluso il loro costante aggiornamento nel tempo;
- saranno monitorati possibili riutilizzi dei dati stessi da parte della collettività.
[:]