Le tecnologie di data virtualization si basano sull’esecuzione distribuita dell’elaborazione dei dati (principalmente per le query), su più origini dati eterogenee e sulla federazione dei risultati delle query in viste virtuali. Parte delle tecnologie di data virtualization anche quelle che consentono “il consumo” di queste viste virtuali da parte degli utenti attraverso applicazioni, strumenti di query/report, layer middleware orientato ai messaggi o altri componenti dell’infrastruttura di gestione dei dati.

Le tecnologie di data virtualization possono essere utilizzate per creare viste virtualizzate e integrate dei dati in memoria, anziché eseguire lo spostamento dei dati e archiviare fisicamente le viste integrate in una struttura dati di destinazione. Di fatto, la data virtualization fornisce un livello di astrazione al di sopra dell’implementazione fisica dei dati, per semplificare la logica delle query.

Come abbiamo avuto modo di descrivere nell’articolo “La virtualizzazione dei dati per una efficace data lineage”, le tecnologie di data virtualization devono essere vista come un “elemento facilitatore” della data governance, soprattutto in relazione all’efficacia che può portare nell’ambito della data lineage.

Le tecnologie di data virtualization e quelle di metadata management e data lineage, secondo l’esperienza di Bnova, sono oggi fondamentali per rispondere alle attuali esigenze delle aziende sul fronte della data governance, punto di partenza per tutte quelle organizzazioni che vogliano sviluppare processi in ottica data-driven.

 

Perché servono le tecnologie di data virtualization e metadata management

 

Il patrimonio informativo di un’azienda rappresenta il motore del suo business. Motore che ha bisogno di una fonte energetica per funzionare, i dati. Se questi dati non contengono informazioni corrette, di qualità, integre e consistenti, l’intero patrimonio risulta compromesso.

I dataset disponibili in azienda arrivano spesso da fonti eterogenee sia interne sia esterne all’azienda, con formati ed estensioni differenti, contenuti strutturati, in alcuni casi, e destrutturati e multimediali in altri (e-mail, conversazioni sui social network, documenti ma anche di immagini e di video).

In un sistema di data governance efficace si deve poter accedere con facilità e rapidità a qualsiasi tipo di fonte. Ed è qui che le tecnologie di data virtualization e quelle di metadata management assumono un ruolo cruciale.

Le tecnologie di data virtualization permettono di recuperare ed utilizzare i dati di qualsiasi forma e fonte, senza spostarli dalla loro origine. Si tratta di uno “strato” software posto tra le fonti di dati (che, come accennato, possono essere sia interne sia esterne alle aziende) e le diverse applicazioni aziendali che “consumano” i dati.

Le tecnologie di data virtualization, in pratica, portano i dati dove servono ma senza spostarli da dove sono, sfruttando la virtualizzazione come sistema di astrazione dei dati. Il software di virtualizzazione dei dati, quindi, non contiene alcun dato ma solo metadati necessari per consentire l’accesso alle varie fonti di dati.

Da qui si intuisce dunque l’importanza delle tecnologie di metadata management. Negli attuali contesti aziendali dove si è in presenza di data lake o di Big Data set, è divenuto ormai indispensabile corredare i dataset di tag e metadati che aiutano i sistemi a riconoscere rapidamente gli input, evitando ridondanze e selezionando ed attingendo ai dati quando servono nel modo più agile e semplice possibile.

La capacità di attribuire tag ai nuovi dati inseriti nei repository (metadata management) è essenziale per affrontare la complessità determinata dalla crescita esponenziale della mole di informazioni a disposizione delle piattaforme analitiche.

Infine, considerando la data lineage quale elemento essenziale di una buona data governance, perché in grado di mappare la discendenza dei dati e quindi di mostrare con chiarezza da dove i dati provengono, come si muovono all’interno dell’azienda, quali trasformazioni vengono loro applicate attraverso molteplici processi e come e quando escono dal patrimonio informativo aziendale, è evidente come la data lineage rappresenti oggi uno degli elementi di informazione più importanti proprio per il metadata management.

 

Le tecnologie di data virtualization targate Denodo

  

Secondo le più recenti recensioni pubblicate su Gartner Peer Insights (giudizi che costituiscono opinioni soggettive dei singoli utenti finali sulla base delle proprie esperienze, non quelle degli analisti della società americana di analisi e ricerche), tra le tecnologie di data virtualization spiccano quelle di Denodo.

Queste le motivazioni di alcuni utenti che stanno utilizzando le tecnologie di data virtualization di Denodo:

  • – ottima piattaforma di virtualizzazione nel caso in cui sia necessario integrare origini dati eterogenee in tutta l’organizzazione e creare report in tempo reale senza duplicazione dei dati;
  • – Denodo fornisce un data mart unificato per ottenere tutti i dati da diverse fonti in un unico posto;
  • – ottimo strumento di virtualizzazione dei dati, che consente agli utenti aziendali di connettere più big data warehouse nel cloud, importante per il self-service data discovery;
  • – installazione e configurazioni semplificate e tool molto semplici da utilizzare;
  • – molteplici funzionalità self-service per sfruttare sia dati strutturati sia dati non strutturati.

 

Metadata management e data lineage con Erwin

  

Sempre attingendo alle recensioni degli utenti raccolte nei Gartner Peer Insights, nell’ambito della data governance, in particolare per le soluzioni tecnologiche di metadata management e di data lineage, spicca il nome di Erwin (by Quest).

Queste le motivazioni che hanno rilasciato alcuni degli utenti che hanno installato le tecnologie di Erwin:

  •  centralizzazione di un’enorme quantità di dati grazie un’interfaccia di elaborazione modulare che incorpora analisi dei dati, ingegneria aziendale, processi aziendali ed elaborazione dei dati;
  • – software di data governace sicuro e “friendly”, ideale per mantenere il massimo livello di sicurezza dei dati;
  • – ideale per data collection e modeling perché permette di avere informazioni precise su tutti i dati gestiti nell’organizzazione aziendale;
  • – gestione efficace dei metadati (in ottica data lineage e data governance consente di sapere sempre dove sono archiviati i metadati);
  • – ottimale per integrare i metadati da utilizzare nel lavoro di mappatura per la gestione del ciclo di vita dei dati, fornisce la derivazione automatizzata dei dati (tracciabilità) e le analisi degli impatti che determinati interventi possono causare sui dati.

Il fìl rouge che sembra legare le recensioni sia per le tecnologie di data virtualization sia per quelle di data governance è la consapevolezza che, di fronte alle nuove sfide di business ed a processi decisionali ed operativi che necessitano del dato quale elemento oggettivo, le soluzioni tecnologiche tradizionali (tra difficoltà di accesso ai dati, alti costi di gestione e integrazione, continue repliche dei dati per effettuare analisi, ecc.) risultano inefficaci e inadeguate. Ecco perché, dunque, sempre più serviranno le tecnologie di data virtualization, di metadata management, di data lineage e, in generale, data governance.

 

Per approfondire le potenzialità della Data Governance e della Data Virtualization non perderti il live talk “Il caos dei dati: come Data Virtualizatione Data Governance ci salveranno dall’effetto farfalla”

New call-to-action


Approfondimenti da BNext:

Soluzioni agili per il Data Management: Logical Data Fabric

Le aziende si trovano ad interfacciarsi con ambienti sempre più diversificati, distribuiti e complessi. Rendere agile la gestione dei dati aziendali diventa quindi una priorità: è necessario guardare oltre le tradizionali pratiche di data management, così da gestire al meglio i costi grazie a soluzioni moderne, come ad esempio il #LogicalDataFabric.

Data Preparation: cos’è e come si esegue la preparazione dei dati

Data Preparation, una disciplina che si occupa di preparare i dati all’utilizzo che si intende effettuare in ambito aziendale. Vediamo cos’è

Cos’è la Data Governance e come implementarla efficacemente

I dati costituiscono la materia prima dell’azienda digitale. Implementarli e gestirli in maniera strategicamente efficiente si rivela fondamentale per successo di un business, ai fini di estrarre il maggior valore possibile in termini di informazioni utili a...

denodo: tutto su cloud, con il supporto della Data Virtualization

Il cloud risolve problemi di gestione costi e risorse, ma aggiunge complessità infrastrutturale: è questo che più frena le aziende nella trasformazione digitale. Denodo è la soluzione di Data Virtualization scelta da BNova

Erwin: dalla data governance alla data democratization

Democratizzazione del dato. Ne abbiamo parlato sotto tante declinazioni. Sicuramente una è quella legata alla Data Governance. Lo strumento leader per fare ciò è Erwin che permette di progettare e creare un’esperienza di organizzazione dati a livello aziendale.

Data Governance: governare processi e responsabilità sui dati. Un use case in ambito finance.

Secondo Gartner erwin by Quest è la soluzione di Data Governance leader di mercato. Ecco i vantaggi in un use case in ambito finance

Denodo: Unified Semantic Layer per portare la democrazia e mettere ordine nel caos

Uno strato semantico unico, senza bisogno complessi processi ETL e senza muovere i dati dalla loro origine

La virtualizzazione dei dati per una efficace data lineage

La data virtualization come tecnologia di integrazione dati. Cos’è e perché è efficace per la data lineage

La data lineage nella Data Governance aziendale

Data lineage: l’origine dei dati, dove e come si spostano nel tempo. Consente di “mappare” tutto il ciclo di vita del dato.

Denodo: quando la Data Virtualization fa la differenza

La data virtualization è trasversale e può fare la differenza in quelle situazioni in cui i dati sono su diverse fonti da integrare