Oggi più che mai i dati digitali rappresentano un vero e proprio asset, un capitale, un importante fattore economico per le aziende di ogni dimensione e settore.  Fino a qualche anno fa le pianificazioni strategiche, produttive e logistiche si basavano quasi esclusivamente sull’esperienza pregressa delle singole persone. Attualmente, ed in particolar modo dopo la diffusione di internet, il mercato tende a diventare sempre più dinamico e competitivo.

Immagine promozionale per il whitepaper su Data Driven

Il semplice know-how non è più sufficiente, in quanto si profila la necessità di conoscere in anticipo le esigenze dei clienti e prevenire le loro richieste. Servono capacità di tipo predittivo. Entra in gioco l’analisi dei dati, elemento centrale di strategie di business sempre più data driven e customer centric. Si inizia a parlare diffusamente di cultura aziendale del dato.

La risposta pratica a questa nuova esigenza risiede nel data management, in cui confluiscono tutti gli aspetti tecnici e metodologici relativi alla gestione dei dati per soddisfare le esigenze multidisciplinari a cui sono soggette oggi le organizzazioni che intendono diventare realmente competitive nei loro mercati di riferimento.

Cos’è il data management: una definizione

Il data management è definibile nell’insieme di tutte le attività associate alla gestione e alla governance dei dati aziendali. La DAMA (Data Management Association) definisce il Data Management in vari modi, tra cui: “Lo sviluppo e l’esecuzione di architetture, policy, pratiche e procedure che gestiscono correttamente le esigenze dell’intero ciclo di vita dei dati di un’azienda” e “La pianificazione, l’esecuzione e la supervisione di policy, pratiche e progetti che acquisiscono, controllano, proteggono, consegnano e aumentano il valore dei dati e delle risorse informative”.

Il fatto che non esista un’unica definizione di data management esprime pienamente il fatto che si tratti di un argomento estremamente multidisciplinare, fondamentale per garantire la qualità e l’integrità dei dati aziendali ai fini di soddisfare qualsiasi esigenza di tipo analitico.

Il data management è determinante a partire dal suo valore strategico. Se i dati costituiscono il potenziale da cui trarre valore aggiunto attraverso le informazioni derivanti dalle applicazioni analitiche, per assicurare che ciò avvenga nella maniera più efficiente è necessario gestirli nel modo migliore, considerando la grande complessità che li interessa, a cominciare dalla loro provenienza da fonti eterogenee, con numeriche sempre più importanti.

La diffusione dei sistemi IoT ha ulteriormente ampliato lo scenario relativo alla raccolta dei dati digitali, coinvolgendo elementi in grado di descrivere i processi produttivi e logistici, attraverso la sensoristica, i dispositivi smart, e tutti i contenuti multimediali trasmessi in streaming. Basti pensare ad una semplice applicazione di videosorveglianza.

Per quanto riguarda la già citata conoscenza dei clienti, appare significativo saper integrare tutti i dati di interazione che essi stabiliscono con i canali aziendali, come il sito internet, l’e-commerce, i social media o i touchpoint degli store fisici, tutti elementi ormai ricorrenti in qualsiasi strategia omnichannel.

I due aspetti citati sono soltanto alcuni tra gli scenari di riferimento per quanto concerne i dati aziendali, ma ci consentono di ottenere una prima percezione in merito alla complessità che rende necessaria una gestione del dato strutturata in maniera rigorosa, senza la quale diventerebbe assai arduo renderle disponibili alle applicazioni analitiche con una integrità ed una qualità adeguata, per ottenere risposte realmente utili alle esigenze di business.

Se i dati costituiscono la risorsa più importante per sbloccare tutto il potenziale di un’organizzazione, il data management diventa un’attività indispensabile per acquisire, integrare, pulire, governare, archiviare e preparare nel modo migliore i contenuti digitali provenienti da tutte le fonti con cui il business aziendale risulta connesso.

Le diverse tipologie di data management

Il data management è un processo in cui concorrono varie discipline, in grado di soddisfare vari requisiti funzionali, che spaziano dallo storage alle applicazioni in grado di elaborati i dati. Da questi elementi appare ad esempio evidente considerare e gestire aspetti come il formato dei file ed altre caratteristiche in grado di assicurare la corretta interoperabilità all’interno di una pipeline che spesso può prevedere anche diverse decine di applicazioni in grado di accedere ai dati ed elaborarli nelle maniere più disparate.

Il primo passo del data management è quasi sempre costituito dalla definizione della data architecture, l’architettura dei dati, soprattutto in quelle organizzazioni che li trattano abitualmente in grandi numeriche.

La data architecture fornisce un blueprint per la gestione dei dati e la disponibilità dei database, oltre che di sistemi come i datalake e i data warehouse, ormai correntemente utilizzati sia on-premise che in cloud. L’architettura prevede quindi anche le specifiche tecnologiche necessarie per soddisfare le esigenze delle singole applicazioni.

In questo contesto, una delle tipologie di data management più diffuse è costituita dall’amministrazione dei database (database administration). I database sono la piattaforma più diffusa a livello aziendale, e contengono una serie di dati organizzati in maniera tale da poter essere aggiornati ed utilizzati da tutte le applicazioni aziendali.

Il loro utilizzo è previsto sia nei contesti transazionali, che prevedono una funzionalità di tipo puramente operativo, che nell’ambito dei data warehouse, dove i dati vengono consolidati per essere resi disponibili alle applicazioni di business intelligence e di business analytics. Si tratta di un ambito di attività estremamente vasto, per cui la database administration costituisce pertanto una delle funzioni più importanti previste nel data management.

L’amministrazione dei database comprende a sua volta varie attività: il design, la configurazione, l’installazione, l’aggiornamento, la manutenzione, la sicurezza, il backup / ripristino e il monitoraggio delle performance, oltre a tutti gli aspetti relativi alle connessioni con le applicazioni che vi accedono.

Tra le altre discipline relative al data management, possiamo sinteticamente citare:

  • Data governance: definisce policy e procedure per garantire la coerenza dei dati in tutte le operazioni previste in ambito aziendale
  • Data integration: si occupa di combinare i dati provenienti dalle differenti fonti, ai fini di renderle disponibili per le applicazioni e gli utilizzi di carattere analitico
  • Data modeling: descrive le relazioni tra i dati e il modo in cui questi vengono veicolati nei vari sistemi che li gestiscono e li elaborano
  • Data quality: riferibile alle attività di data preparation per pulire i dati, eliminare errori e duplicati, oltre a garantire il corretto formato per tutti gli utilizzi di carattere applicativo
  • Data observability: uno dei processi di più recente evoluzione nell’ambito del data management, che mira ad incrementare l’efficienza della data governance e della data quality attraverso una miglior visibilità della data pipeline, ottenibile mediante soluzioni di monitoraggio automatizzate.

Perché è così importante

Come citato in sede di premessa, nel contesto della trasformazione digitale, i dati diventato un asset fondamentale per prendere decisioni più informate e consapevoli in tantissimi ambiti, come le campagne di marketing, le operazioni di business e in generale qualsiasi contesto in cui si renda necessario prevedere andamenti di mercato e contenere i costi e i tempi relativi a determinati processi.

Il data management consente, come il nome stesso suggerisce, di gestire i dati in maniera efficiente, con l’obiettivo di incrementare i ricavi e i profitti delle organizzazioni, ottimizzando al tempo stesso tutte le risorse necessarie per sostenere le varie attività di business.

Una consapevole gestione del dato consente di ottenere risposte pratiche per raggiungere tali obiettivi, a cominciare dall’abbattimento dei tradizionali data silos, che da sempre limitano l’attività sinergica tra le varie linee di business delle organizzazioni.

Grazie alla costituzione di una base unificata di dati, è possibile renderli disponibili in maniera coerente, garantendo agli utenti e ai dispositivi informatici che vi accedono una visibilità altrimenti impossibile. Allo stesso modo, la corretta gestione del dato consente di ottenere un livello qualitativo attraverso cui le applicazioni analitiche possono elaborare informazioni coerenti e realmente utili al supporto decisionale per cui sono previste.

Per arrivare ad ottenere risultati soddisfacenti, occorre procedere step by step, integrando sistemi e procedure in grado di dare forma a metodologie consolidate, dove l’azione delle piattaforme di data management assume una rilevanza irrinunciabile nel contesto di un IT aziendale realmente all’altezza della situazione.

Un ulteriore aspetto per cui il data management assume una rilevanza cruciale è definito dagli aspetti normativi. Soltanto attraverso una gestione corretta e consapevole è oggi possibile soddisfare le prescrizioni del GDPR e di tutti i dispositivi che regolano la conservazione e il trattamento dei dati, così come la loro protezione e gli aspetti relativi alla sicurezza informatica.

I rischi e le sfide

Le organizzazioni si ritrovano ogni giorno alle prese con volumi di dati in costante aumento. Senza una adeguata attività di data management, la gestione dei dati risulterebbe oltremodo complessa, dispersiva, con il rischio di compromettere i tempi e i costi relativi alle operazioni aziendali.

Tuttavia, quando oggi si parla di data management, ci si scontra inevitabilmente con una complessità nativa, data dall’estrema eterogeneità di dati strutturati, semistrutturati e non strutturati, come i contenuti audio e video delle applicazioni multimediali.

In questo contesto, come se non bastasse, quando si decide di implementare una strategia di gestione dei dati, si parte molto spesso da architetture fragili, derivanti da successive stratificazioni di servizi e soluzioni che hanno prodotto come risultato la formazione dei famigerati data silos, che rendono inefficiente quello scambio di informazioni indispensabile per rendere efficienti i processi delle varie linee di business che interagiscono con i dati aziendali.

Una delle principali sfide da affrontare nel contesto del data management coincide pertanto nel garantire che i set di dati siano accurati e coerenti su tutti i sistemi di gestione.

Un’altra complessità ricorrente nell’ambito del data management è costituita dal fatto di disporre di molti sistemi, tra cui figurano database, data lake, data warehouse on-premise e in cloud. Questa straordinaria ibridazione, anche quando è perfettamente risolta a livello IT, può comportare varie complessità in termini di gestione.

A livello operativo uno degli aspetti più complessi è dato dal sapere cosa è disponibile e dove è disponibile. Per risolvere questo problema le piattaforme di data management dispongono di tool in grado di utilizzare i metadati per la catalogazione. In questo contesto convergono anche discipline come il data lineage.

Il cloud costituisce una enorme opportunità per la trasformazione digitale, ma comporta a sua volta una serie di complessità a livello di gestione dei dati. Si pensi, ad esempio, alla migrazione in cloud di un database on-premise per rendere disponibili i dati alle applicazioni moderne, che comporta l’adozione di tecnologie di nuova generazione, non sempre compatibili con i sistemi tradizionali.

I sistemi IT ibridi comportano inoltre complessità dal punto di vista dell’accesso ai dati e nel garantire ad utenti e dispositivi le opportune autorizzazioni. Il proliferare di piattaforme basate su logiche Zero Trust costituisce una soluzione possibile, a patto che in azienda vi sia una adeguata cultura del dato anche per quanto concerne gli aspetti legati alla sicurezza informatica, per evitare rischi dovuti alla violazione dei dati, da cui possono derivare danni economici e reputazionali spesso fatali per le sorti dell’organizzazione.

Alcune best practice per il data management

Le sfide relative al data management possono essere affrontate e risolte con successo grazie ad una serie di best practice che derivano da una prassi ormai decisamente consolidata, a patto di saperle implementare in maniera corretta e consapevole nei sistemi aziendali. Tali attività prevedono solitamente consulenze specializzate, in grado da agire in primo luogo quali mediatori culturali in un ambito fortemente multidisciplinare.

Immagine promozionale per il whitepaper su Data Driven
Livello di discovery per identificare i datiLa creazione di un apposito livello di discovery consente agli analisti e ai data scientist di individuare in maniera efficiente i dataset e renderli disponibili per le loro applicazioni di business intelligence e business analytics  
Predisporre livelli di query comuni per gestire lo storage dei dati  Le piattaforme di data management prevedono tool in grado di far interagire tra loro vari sistemi di storage in maniera trasparente per l’utente finale. L’applicazione di una layer di query comune per i diversi tipi di storage dei dati consente in buona sostanza di sfruttare le tecnologie di virtualizzazione per accedere ai dati senza dover necessariamente conoscere la loro posizione fisica.  
Database con prestazioni adeguate a garantire le esigenze di business  Anche se appare scontato a dirsi, la dotazione di una piattaforma di database dotata di performance, scalabilità e disponibilità per soddisfare tutti i carichi di lavoro ottimizzando i costi generali è un’attività tutt’altro che banale. L’obiettivo del data management, in questo contesto, risiede nell’unificare le basi di dati per poterli analizzare in maniera più efficace, supportando nel migliore dei modi i processi decisionali. Avvalersi di database scalabili è pertanto indispensabile per ottimizzare il dispendio di risorse dovuto alle applicazioni analitiche, senza rischiare, per contro, di ritrovarsi al cospetto di pericolosi colli di bottiglia.  
Favorire l’automazione e il riutilizzo dei dati  Le numeriche in ballo e la varietà delle fonti da cui provengono rendono di fatto assai ardua una preparazione dei dati di tipo manuale, come avveniva nel contesto tradizionale. Occorre dotarsi di piattaforme software in grado di automatizzare la trasformazione dei dati, favorendo la data quality e il riutilizzo stesso dei dati in più applicazioni  
Monitorare le performance e favorire l’adozione di strumenti AI e ML  Il crescente utilizzo di applicazioni basate su tecniche di machine learning può favorire sia il monitoraggio dei sistemi di gestione dei dati, garantendo elevati di livelli di performance. Ciò è ad esempio possibile aggiornando e ottimizzando l’indicizzazione dei dati con il variare dei contenuti, per rendere rapide ed efficienti le query. In questo modo i database possono mantenere tempi di risposta bassi e garantire ai data analyst e ai data scientist di risparmiare molto tempo, eliminando a priori una serie di problemi che tradizionalmente venivano risolti in maniera manuale.  
Utilizzo di tool in grado di assicurare la coerenza con le normative sui dati  Le piattaforme di data management prevedono tool in grado di analizzare i dati e identificare eventuali problemi relativi alla compliance con il GDPR e le altre normative vigenti in materia di conservazione, trattamento e protezione dei dati stessi. Anche in questo caso, appare decisamente improbabile svolgere questo tipo di operazioni in maniera manuale, oltretutto considerando le competenze di carattere legale che ciò comporta.  
Utilizzo di database convergenti  L’utilizzo di database dotati di supporto nativo per tutti i dati moderni facilita lo sviluppo di modello integrati e facilmente fruibili da varie applicazioni. I database convergenti possono inoltre facilitare l’integrazione nei processi aziendali di varie tecnologie emergenti, tra cui IoT, blockchain e machine learning  
ARGOMENTI CORRELATI
Categoria: ANALYTICS
Gruppo di colleghi osservano il pc di uno di loro confrontando si sui dati

Data mart: spiegazione completa e confronto con data warehouse

La capacità di analizzare rapidamente grandi volumi di dati e trasformarli in informazioni strategiche è diventata ormai un asset fondamentale… Leggi tutto

Immagine di colleghe che lavorano assieme al pc

Manutenzione predittiva: significato, esempi e vantaggi

Nel contesto industriale odierno, caratterizzato da una crescente digitalizzazione e interconnessione, la manutenzione predittiva emerge come una soluzione strategica per… Leggi tutto

Tre colleghi osservano grafici e dati su un monitor pc

Database Management System: cosa sono e quando utilizzarli

I Database Management System (DBMS) sono sistemi software progettati per creare, gestire e manipolare basi di dati, in funzione di… Leggi tutto