Per potersi affidare ai dati e diventare realmente un’organizzazione Data Driven, occorre innanzitutto fidarsi di essi; uno degli elementi fondamentali in tal senso è utilizzare tecniche e soluzioni di Data Lineage. 

La Data Lineage è la tecnica che consente di identificare e rappresentare il ciclo di vita del dato da quando entra nella nostra organizzazione fino a quando ne esce, tenendo traccia delle trasformazioni che subisce nel tempo, di quali sono i principali processi che lo coinvolgono e le interdipendenze di quest’ultimi con gli altri sistemi aziendali. 

È chiaro quindi, sin dalla sua definizione, che la Data Lineage è un elemento fondamentale, in generale per la Data Governance e ancora di più per la Data Quality, perché maggiore è la conoscenza di sistemi, processi e trasformazioni che caratterizzano i dati, tanto più efficace è l’attuazione dei controlli su di essi. 

 

Il rischio del telefono senza fili 

Il rischio di non adottare efficaci soluzioni di Data Lineage è quello che si ha quando si gioca al telefono senza fili: le parole immesse nel sistema dal primo giocatore possono essere completamente stravolte durante il passaparola che caratterizza il gioco, con il rischio che l’ultimo giocatore pronunci parole completamente diverse da quella originali cambiando il significato della frase iniziale, senza essere in grado di ricostruire in quale punto le parole siano state cambiate. 

Sostituendo le parole con i dati, questo è proprio ciò che accade in un’azienda in assenza di un sistema di Data Lineagei dati, durante il loro ciclo di vita, scorrono all’interno di un flusso attraverso architetture complesse, soluzioni e processi e, se non adeguatamente gestistipossono subire l’applicazione di regole sbagliate possono essere carenti di informazionie arrivare alla fine del loro ciclo (ad esempio la produzione di un report) senza che nessuno sia in grado di spiegare dove e perché l’errore o la modifica sia stato generato. 

Clienti, legislatori e business users hanno bisogno di dati sicuri e conformi, questi dati devono essere disponibili quando e dove sono necessari e, in ogni momento, occorre essere in grado di ricostruirne la storia; questa necessità diventa ancora maggiore all’interno di organizzazioni complesse dove tipicamente troviamo grandi piattaforme utilizzate da molti utenti, dati in vari formati e architetture ibride (sia cloud che tradizionali). 

 

Il valore della Data Lineage   

La Data Lineage offre numerosi vantaggi a tutti coloro che hanno a che fare con i dati e in generale ai sistemi di Data Governance: 

  • Analisi dei Data Incidentspesso gli errori sui dati vengono riscontrati solo alla fine del processo che li coinvolge, tipicamente quando viene letto un report; spesso però l’errore è originato molto più a monte. La Data lineage consente di ricostruire agevolmente e velocemente la catena che ha prodotto quel dato e, quindi, di individuare facilmente il momento in cui l’errore è stato introdotto.  
  • Impact Analysis: è spesso necessario fare delle modifiche ai sistemi esistenti, per motivi normativi, di business o per il cambio di alcuni sistemi software. Quando il cambiamento coinvolge i dati, la Data Lineage consente di valutare a priori quali applicazioni, quali dati e quali processi a valle saranno interessati dalla modifica e aiuta a pianificare gli aggiornamenti delle varie applicazioni. 
  • Performance Assessment: la Data Lineage consente di individuare eventuali “colli di bottiglia” nella gestione dei dati e consente, quindi, di intervenire con soluzioni alternative che possono essere valutate mediante l’impact analysis. 

 

Data lineage, Data Governance e Data Quality 

Come precedentemente anticipato tra Data Lineage, Data Governance e Data Quality c’è un forte legame di interdipendenzaLa Data Lineage indica da dove i dati provengono, dove stanno andando e quali trasformazioni vengono loro applicate attraverso molteplici processi: è uno dei processi di informazione più importante per il Metadata Management. 

Dal punto di vista della Data Quality e della Data Governance, è importante utilizzare la Data Lineage per garantire che esistono regole aziendali, che vengono applicate dove previsto, che le regole di calcolo e altre trasformazioni sono corrette e che input e output di sistemrisultano compatibili.  

La tracciabilità dei dati, garantita dalla Data Lineage, è inoltre lo strumento migliore per la validazione dei dati e rappresenta uno strumento di controllo relativo al loro utilizzo anche a scopo di audit e di conformità alle normative. 

 

Il collegamento tra il business e le operation 

Mappare i processi da un punto di vista business e farlo da un punto di vista tecnico/operativo è piuttosto diverso; ma ovviamente una connessione esiste: sia dietro al business che alle operations ci sono i dati. 

Attraverso la creazione dei metadati di business e della loro controparte tecnica, e seguendo il ciclo di vita del dato, ovvero usando la Data Lineage, è possibile costruire tale connessione. 

Il risultato è sorprendente, poiché è possibile individuare un determinato metadato di business e tracciarlo su più applicazioni, fonti dati, interfacce, modelli, analisi, report e altri elementi. Ciò garantisce a tutta l’organizzazione aziendale la massima affidabilità del dato, la trasparenza nella sua gestione e la possibile collaborazione a tutti i livelli. 

New call-to-action