Welcome dati.camera.it

Siamo davvero contenti che, dal 20 dicembre, ci sia dati.camera.it, il portale con cui il parlamento italiano “libera” i suoi primi dati in formato aperto e interoperabile; e speriamo che l’iniziativa sia solo il primo passo verso una presa di coscienza rispetto all’importanza di rendere i dati non solo pubblici ma soprattutto usabili.

Si tratta di un autorevole esempio di open data istituzionale che espone informazioni storiche della camera e del senato dal Regno ad oggi. Una mole di dati considerevole che collega persone, legislature, leggi, atti e organi parlamentari. Il tutto aderendo a standard W3C e Linked Data best practices e costruendo un portale ricco e interessante da navigare. Oltre ai dump RDF e allo SPARQL endpoint di ordinanza, infatti, alcune apps e una demo basata su uno strumento open-source (http://code.google.com/p/elda/) mostrano alcune visualizzazioni sui dati pubblicati: se usato, il portale si rivelerà senz’altro un eccezionale strumento perfare ricerche tra politici, proposte di legge e gruppi parlamentari.

Gli stessi dati fanno da motore al portale storia.camera.it: qui i dati sono navigabili in tanti modi diversi e facendo largo uso di faceted browsing ma anche di un’interfaccia ben fatta.
Se viene subito e in mente una sovrapposizione con openparlamento.it, che tutti conosciamo, sarebbe interessante vedere in un prossimo futuro una qualche integrazione tra questi dati ufficiali del parlamento e quelli “crowdsourced” (e più “freschi”) dell’associazione romana. Che in alcuni casi sono più ricchi, comprendendo votazioni, statistiche e “indici di produtticità” dei parlamentari.

Ovviamente la tentazione di giochicchiare immediatamente con i dati è stata forte. Ed abbiamo subito ceduto. Un gran bel lavoro dal punto di vista del modello dati, che è chiaro e riusa dove possibile ontologie esistenti, come DC e FOAF. E se i dati non sono linkati ad altri dataset LOD, raramente i nostri deputati “esistono” in Freebase o DBPedia.

Abbiamo messo alla prova l’endpoint montato su OpenLink Virtuoso con alcune query per estrarre semplici serie statistiche, ad esempio confrontare il numero di leggi promulgate dalle varie legislature e la loro durata, e la stessa cosa può essere fatta per quantificare gli atti parlamentari, le sedute e le discussioni.

Prima di concludere, qualche osservazione:

- Tanto per trovare il pelo nell’uovo :-) (ma crediamo possa essere una utile segnalazione per coloro che i dati li hanno pubblicati), abbiamo notato la presenza di alcune risorse “rotte” (o così ci sembra).
Ad esempio, questa

http://dati.camera.it/ocd/legislatura.rdf/repubblica_2

non ha “tipo”, come si evince dalla query “SELECT ?x WHERE { rdf:type ?x. }, e pare essere concettualmente identica a http://dati.camera.it/ocd/legislatura.rdf/repubblica_02 , che ha una rappresentazione più completa e molti più atti parlamentari collegati.

- Peccato inoltre che le durate di governi e legislature siano in questo formato “20060428-20080428″. Meglio sarebbe stato avere una descrizione più strutturata del periodi temporali, per poter lanciare query più precise.

- I dati non sono linkati a dataset esistenti. Ma “indiscrezioni” sembrano indicare che i lavori in questa direzione sono già “in progress”, con l’intento di collegare persone e luoghi a DBPedia e Geonames. Ci sentiamo di suggerire anche Freebase come “target”, visto che i dati sono considerevolmente più consistenti e riutilizzabili e che il roconciliation service di Freebase può essere un ottimo strumento per automatizzare la procedura di linking.

Siamo sicuri che in questo momento molti in Italia stanno già arrovellandosi per riusare questi dati in modo creativo e utile.

Beh … avvertiteci in caso :-)