Le tecnologie di data virtualization si basano sull’esecuzione distribuita dell’elaborazione dei dati (principalmente per le query), su più origini dati eterogenee e sulla federazione dei risultati delle query in viste virtuali. Parte delle tecnologie di data virtualization anche quelle che consentono “il consumo” di queste viste virtuali da parte degli utenti attraverso applicazioni, strumenti di query/report, layer middleware orientato ai messaggi o altri componenti dell’infrastruttura di gestione dei dati.

Le tecnologie di data virtualization possono essere utilizzate per creare viste virtualizzate e integrate dei dati in memoria, anziché eseguire lo spostamento dei dati e archiviare fisicamente le viste integrate in una struttura dati di destinazione. Di fatto, la data virtualization fornisce un livello di astrazione al di sopra dell’implementazione fisica dei dati, per semplificare la logica delle query.

Come abbiamo avuto modo di descrivere nell’articolo “La virtualizzazione dei dati per una efficace data lineage”, le tecnologie di data virtualization devono essere vista come un “elemento facilitatore” della data governance, soprattutto in relazione all’efficacia che può portare nell’ambito della data lineage.

Le tecnologie di data virtualization e quelle di metadata management e data lineage, secondo l’esperienza di Bnova, sono oggi fondamentali per rispondere alle attuali esigenze delle aziende sul fronte della data governance, punto di partenza per tutte quelle organizzazioni che vogliano sviluppare processi in ottica data-driven.

 

Perché servono le tecnologie di data virtualization e metadata management

 

Il patrimonio informativo di un’azienda rappresenta il motore del suo business. Motore che ha bisogno di una fonte energetica per funzionare, i dati. Se questi dati non contengono informazioni corrette, di qualità, integre e consistenti, l’intero patrimonio risulta compromesso.

I dataset disponibili in azienda arrivano spesso da fonti eterogenee sia interne sia esterne all’azienda, con formati ed estensioni differenti, contenuti strutturati, in alcuni casi, e destrutturati e multimediali in altri (e-mail, conversazioni sui social network, documenti ma anche di immagini e di video).

In un sistema di data governance efficace si deve poter accedere con facilità e rapidità a qualsiasi tipo di fonte. Ed è qui che le tecnologie di data virtualization e quelle di metadata management assumono un ruolo cruciale.

Le tecnologie di data virtualization permettono di recuperare ed utilizzare i dati di qualsiasi forma e fonte, senza spostarli dalla loro origine. Si tratta di uno “strato” software posto tra le fonti di dati (che, come accennato, possono essere sia interne sia esterne alle aziende) e le diverse applicazioni aziendali che “consumano” i dati.

Le tecnologie di data virtualization, in pratica, portano i dati dove servono ma senza spostarli da dove sono, sfruttando la virtualizzazione come sistema di astrazione dei dati. Il software di virtualizzazione dei dati, quindi, non contiene alcun dato ma solo metadati necessari per consentire l’accesso alle varie fonti di dati.

Da qui si intuisce dunque l’importanza delle tecnologie di metadata management. Negli attuali contesti aziendali dove si è in presenza di data lake o di Big Data set, è divenuto ormai indispensabile corredare i dataset di tag e metadati che aiutano i sistemi a riconoscere rapidamente gli input, evitando ridondanze e selezionando ed attingendo ai dati quando servono nel modo più agile e semplice possibile.

La capacità di attribuire tag ai nuovi dati inseriti nei repository (metadata management) è essenziale per affrontare la complessità determinata dalla crescita esponenziale della mole di informazioni a disposizione delle piattaforme analitiche.

Infine, considerando la data lineage quale elemento essenziale di una buona data governance, perché in grado di mappare la discendenza dei dati e quindi di mostrare con chiarezza da dove i dati provengono, come si muovono all’interno dell’azienda, quali trasformazioni vengono loro applicate attraverso molteplici processi e come e quando escono dal patrimonio informativo aziendale, è evidente come la data lineage rappresenti oggi uno degli elementi di informazione più importanti proprio per il metadata management.

 

Le tecnologie di data virtualization targate Denodo

  

Secondo le più recenti recensioni pubblicate su Gartner Peer Insights (giudizi che costituiscono opinioni soggettive dei singoli utenti finali sulla base delle proprie esperienze, non quelle degli analisti della società americana di analisi e ricerche), tra le tecnologie di data virtualization spiccano quelle di Denodo.

Queste le motivazioni di alcuni utenti che stanno utilizzando le tecnologie di data virtualization di Denodo:

  • – ottima piattaforma di virtualizzazione nel caso in cui sia necessario integrare origini dati eterogenee in tutta l’organizzazione e creare report in tempo reale senza duplicazione dei dati;
  • – Denodo fornisce un data mart unificato per ottenere tutti i dati da diverse fonti in un unico posto;
  • – ottimo strumento di virtualizzazione dei dati, che consente agli utenti aziendali di connettere più big data warehouse nel cloud, importante per il self-service data discovery;
  • – installazione e configurazioni semplificate e tool molto semplici da utilizzare;
  • – molteplici funzionalità self-service per sfruttare sia dati strutturati sia dati non strutturati.

 

Metadata management e data lineage con Erwin

  

Sempre attingendo alle recensioni degli utenti raccolte nei Gartner Peer Insights, nell’ambito della data governance, in particolare per le soluzioni tecnologiche di metadata management e di data lineage, spicca il nome di Erwin (by Quest).

Queste le motivazioni che hanno rilasciato alcuni degli utenti che hanno installato le tecnologie di Erwin:

  •  centralizzazione di un’enorme quantità di dati grazie un’interfaccia di elaborazione modulare che incorpora analisi dei dati, ingegneria aziendale, processi aziendali ed elaborazione dei dati;
  • – software di data governace sicuro e “friendly”, ideale per mantenere il massimo livello di sicurezza dei dati;
  • – ideale per data collection e modeling perché permette di avere informazioni precise su tutti i dati gestiti nell’organizzazione aziendale;
  • – gestione efficace dei metadati (in ottica data lineage e data governance consente di sapere sempre dove sono archiviati i metadati);
  • – ottimale per integrare i metadati da utilizzare nel lavoro di mappatura per la gestione del ciclo di vita dei dati, fornisce la derivazione automatizzata dei dati (tracciabilità) e le analisi degli impatti che determinati interventi possono causare sui dati.

Il fìl rouge che sembra legare le recensioni sia per le tecnologie di data virtualization sia per quelle di data governance è la consapevolezza che, di fronte alle nuove sfide di business ed a processi decisionali ed operativi che necessitano del dato quale elemento oggettivo, le soluzioni tecnologiche tradizionali (tra difficoltà di accesso ai dati, alti costi di gestione e integrazione, continue repliche dei dati per effettuare analisi, ecc.) risultano inefficaci e inadeguate. Ecco perché, dunque, sempre più serviranno le tecnologie di data virtualization, di metadata management, di data lineage e, in generale, data governance.

 

Per approfondire le potenzialità della Data Governance e della Data Virtualization non perderti il live talk “Il caos dei dati: come Data Virtualizatione Data Governance ci salveranno dall’effetto farfalla”

New call-to-action


Approfondimenti da BNext:

Data Fabric: cos’è e quali i vantaggi nel suo utilizzo

Le aziende si trovano ad interfacciarsi con ambienti sempre più diversificati, distribuiti e complessi. Rendere agile la gestione dei dati aziendali diventa quindi una priorità: è necessario guardare oltre le tradizionali pratiche di data management, così da gestire al meglio i costi grazie a soluzioni moderne, come ad esempio il #LogicalDataFabric.

Data Lineage: come assicurarsi qualità e integrità dei dati

Tracciare i dati attraverso il loro ciclo di vita è un tema di valenza strategica. Perché una corretta Data Lineage ci garantisce l’accuratezza e l’integrità dei dati?

Cos’è la Data Quality e le metriche di riferimento

La Data Quality è una misura della condizione dei dati basata su fattori quali accuratezza, completezza, coerenza, affidabilità e se sono aggiornati. La misurazione dei livelli di qualità dei dati può aiutare le organizzazioni a identificare gli errori nei dati che...

Data as a Service: cos’è a cosa serve

I modelli a servizi disponibili in cloud consentono di avere nuove opzioni di utilizzo dei dati, molto più flessibili e scalabili rispetto ai sistemi di gestione tradizionali. È il caso del Data as a Service (Daas), una soluzione strategica in grado di semplificare...

Fare ordine tra i dati: dalla Data Quality alla Data Governance 

Mettere ordine tra i propri dati aziendali è il primo passo, lo step fondamentale per riuscire a governarli e ad utilizzarli nel modo più opportuno e proficuo per l’azienda.   Diamo qui per scontato che i dati aziendali siano “sporchi” per natura, perché...

Data literacy: cos’è e perché è fondamentale per la tua impresa

Al giorno d’oggi si sente spesso parlare di strategie Data Driven e della necessità di avere consapevolezza e controllo dei propri dati; si stima, infatti, che 6 aziende su 10 siano ben consapevoli dell’impellente necessità di ottimizzare la propria conoscenza dei...

Data migration: cos’è, come si esegue e le best practice

La trasformazione digitale ha causato un notevole aumento delle attenzioni dedicate alla Data Governance, la cui qualità è assolutamente determinante per il successo di una strategia di business. Le aziende devono dedicare importanti risorse all’integrazione e alla...

Data Preparation: cos’è e come si esegue la preparazione dei dati

Data Preparation, una disciplina che si occupa di preparare i dati all’utilizzo che si intende effettuare in ambito aziendale. Vediamo cos’è

Cos’è la Data Governance e come implementarla efficacemente

I dati costituiscono la materia prima dell’azienda digitale. Implementarli e gestirli in maniera strategicamente efficiente si rivela fondamentale per successo di un business, ai fini di estrarre il maggior valore possibile in termini di informazioni utili a...

Data Governance: cosa può fare per aiutare il business

La Data Governance è di supporto per aumentare efficacia ed efficienza dei processi, aiuta a gestire la sicurezza, la privacy, ad ottimizzare le risorse e a garantire agli utenti trasparenza ed affidabilità