Mettere ordine tra i propri dati aziendali è il primo passo, lo step fondamentale per riuscire a governarli e ad utilizzarli nel modo più opportuno e proficuo per l’azienda.  

Diamo qui per scontato che i dati aziendali siano “sporchi” per natura, perché provengono da fonti eterogenee spesso relative ad ambiti diversi (social, CRM, marketing, produzione, logistica, …), perché sono memorizzati in dataset strutturati e non, ed anche perché, nei diversi passaggi, subiscono trasformazioni diverse per rispondere ad esigenze specifiche. È chiaro quindi che una fase di preparazione sia necessaria per poter pensare di integrarli in un’unica soluzione, ma anche soltanto per interfacciarsi a tutti loro in modo coerente o per riuscire ad analizzarli con meccanismi di Machine Learning e sfruttare quindi le informazioni nascoste. I motivi per cui si parla così spesso di questa prima fase e si concentrano così tante energie per garantire la Data Quality possono essere riassunti in pochi ma fondamentali punti: 

  • – Il costo di lavorare con dati “sporchi” o inconsistenti supera ogni anno centinaia di miliardi di dollari. Avere a che fare con dati di scarsa qualità è infatti la principale causa del superamento dei costi previsti nel budget di progetto. 
  • – La scarsa qualità dei dati rappresenta quasi in 1 progetto su 2 un ostacolo all’adozione di soluzioni di BI e Advanced Analytics a causa dell’inconsistenza dei risultati che si otterrebbero. 

Se quindi ci è ben chiaro cosa sia la Data Preparation e perché si tratta di un passaggio essenziale, ci concentriamo adesso sulle caratteristiche della Data Quality e sul perché è importante e funzionale alla Data Governance. 

Cos’è la Data Quality e perché è fondamentale 

Secondo DAMA la Data Quality “consiste nella pianificazione, implementazione e controllo delle attività che applicano tecniche di gestione della qualità dei dati, al fine di garantire che siano adatti allo scopo e soddisfino le esigenze degli utilizzatori.”

I dati sono infatti considerati ormai un asset fondamentale per le aziende e, come tale, la loro qualità condiziona in modo inevitabile il business e le decisioni prese in ottica Data Driven: è a partire dai dati opportunamente analizzati che, infatti, si arriva a comprendere il contesto aziendale e a creare quella conoscenza che guida e genera le intuizioni di business che portano, a loro volta, ad un vantaggio competitivo. Se però i dati di partenza sono di scarsa qualità ne risente tutto il processo. È una situazione paragonabile alla qualità delle fondamenta di una casa: se sono solide e ben strutturate possiamo aspettarci di resistere anche ai terremoti più forti, ma se sono costruite con materiali di scarsa qualità c’è il forte rischio che l’intera casa sia in pericolo anche con una piccola scossa. 

Questo approccio è confermato anche da Gartner, secondo cui “la scarsa qualità dei dati distrugge il valore del business. Una recente ricerca indica che le organizzazioni stimano il costo medio della scarsa qualità dei dati a 10,8 milioni di dollari all’anno, un numero destinato ad aumentare man mano che gli ambienti di business diventano sempre più digitalizzati e complessi”. 

Le anomalie presenti nelle basi dati, anche quelle che sembrano più “inoffensive” rischiano di portare gravi danni nel medio-lungo termine. Ad esempio se in un CRM viene memorizzato un indirizzo sbagliato rischiamo di non riuscire a contattare il cliente, non recapitargli una fattura, nè una spedizione, e di conseguenza potrei perdere il cliente ed anche generare un effetto farfalla con ripercussioni sul profilo di rischio aziendale o sulla propria reputazione. Ancora più gravi sono poi le situazioni in cui le decisioni strategiche sono prese a partire da dati non corretti e quindi porteranno risultati distorti e potenzialmente nocivi per le prestazioni dell’organizzazione. 

Ecco perché pensare da subito a garantire la qualità dei dati aziendali è così fondamentale

Le linee guida per garantire la qualità dei dati

Sembra difficile poter garantire tutti gli aspetti che influiscono sulla qualità dei dati. Possiamo però fornire delle linee guida, 4 caratteristiche che i dati devono avere per poter essere considerati dati di qualità:  

  • accuratezza intesa come il grado di corrispondenza del dato misurato con il dato di riferimento, la vicinanza del valore riscontrato all’aspettativa.  L’accuratezza è legata anche al concetto di validità, intesa come la conformità del dato ad una specifica sintassi (un tipo, un formato, un range di valori ammissibili); 
  • attendibilità ovvero affidabilità del dato, vista non solo in relazione alla fonte, più o meno autorevole, da cui proviene, ma anche rispetto al processo di trasformazione che subisce, fattori che influiscono sulla “fiducia” che l’utente finale ripone sul dato ottenuto; 
  • completezza, non devono presentarsi “buchi informativi”, i dati devono coprire l’intero periodo e i diversi aspetti senza mancanze od omissioni; 
  • consistenza, i dati aziendali che vengono memorizzati ed usati nelle analisi devono essere significativi, informativi, ed essere effettivamente utilizzabili nelle applicazioni aziendali.  

Dalla Data Quality alla Data Governance 

La Data Governance è definita da DAMA come la “pietra angolare” di tutte le discipline di knowledge coinvolte nella gestione dei dati. Nonostante questo solo una decina di anni fa si è cominciato a parlarne in modo più strutturato e il primo settore in cui si è fatta strada è il finance nel tentativo di garantire la compliance alle normative relative alla privacy e alla sicurezza dei dati. Fino ad allora i processi di governo dei dati erano guidati di fatto dal buon senso, senza iniziative concrete o comuni. 

Con l’introduzione di questi obblighi regolamentari le aziende sono adesso vincolate a ricercare processi di gestione dei dati universalmente riconosciuti. Si tratta di processi necessari, ma che comportano comunque un costo per l’azienda, un impiego di risorse importante di cui non è immediato vedere i ritorni. Per questo motivo le aziende non possono rischiare di impostarli in modo non corretto o, ancor peggio, di basarli su dati “sporchi”, di cattiva qualità, ed è quindi normale che questa spinta sia stata una delle leve più efficaci per avviare programmi di data quality. 

In questo senso la data quality è solo un primo passo verso una data governance matura; l’inizio di un percorso che non solo molte banche e assicurazioni, ma anche aziende ormai di tutti i settori, stanno perseguendo con grande determinazione, non solo spinti da obblighi di compliance, ma con la convinzione che possa contribuire a generare un valore concreto e percepibile

ARGOMENTI CORRELATI
Categoria: DATA GOVERNANCE
Logical Data Fabric - concept grafico per richiamare la rete di interconnessione tra dati creata con il logical data fabric. Immagine che raffigura una rete e le connessioni tra nodi che rappresentano i dati e gli strumenti

Data Fabric: cos’è e quali i vantaggi nel suo utilizzo

Le aziende si trovano ad interfacciarsi con ambienti sempre più diversificati, distribuiti e complessi. Rendere… Leggi tutto

Due persone osservano il monitor di un pc con sullo sfondo altre due persone che osservano anche loro un monitor

Data Lineage: come assicurarsi qualità e integrità dei dati

Tracciare i dati attraverso il loro ciclo di vita è un tema di valenza strategica.… Leggi tutto

Data Quality - concept per richiamare l'attenzione sul concetto di aiuto e supporto per superare una difficoltà. Immagine che raffigura due uomini che scalano una montagna, uno aiuta l'altro a salire sulla cima

Cos’è la Data Quality e le metriche di riferimento

La Data Quality è una misura della condizione dei dati basata su fattori quali accuratezza,… Leggi tutto