Il 19 febbraio u.s. è stato reso disponibile, sul sito web di AgID, il catalogo nazionale dei dati della pubblica amministrazione.
Avendo partecipato al censimento di tali dati, incuriosito dal metodo di rilevazione, che prevedeva la compilazione di un foglio elettronico, con pochissimi campi vincolati, mi sono chiesto: come faranno mai in AgID a normalizzare i dati. Spinto da tale curiosità ho scaricato la banca dati messa a disposizione sul sito dell'Agenzia ed ho provato a generare un po di dati statistici, giusto per verificare sino a che punto la famosa affermazione “GIGO” (Garbage In Garbage Out) fosse vera.
I risultati ottenuti dall'analisi statistica del “catalogo” in argomento ha messo in luce gli effetti previsti: gli stessi produttori software sono stati caricati nel catalogo con decine e decine di nomi diversi, più di 17.000 basi dati censite sono state caricate più volte da parte delle stesse amministrazioni, i campi della rilevazione sono stati compilati con la fantasia del più creativo romanziere di fantascienza, etc etc.