Le tecnologie di data virtualization si basano sull’esecuzione distribuita dell’elaborazione dei dati (principalmente per le query), su più origini dati eterogenee e sulla federazione dei risultati delle query in viste virtuali. Parte delle tecnologie di data virtualization anche quelle che consentono “il consumo” di queste viste virtuali da parte degli utenti attraverso applicazioni, strumenti di query/report, layer middleware orientato ai messaggi o altri componenti dell’infrastruttura di gestione dei dati.

Le tecnologie di data virtualization possono essere utilizzate per creare viste virtualizzate e integrate dei dati in memoria, anziché eseguire lo spostamento dei dati e archiviare fisicamente le viste integrate in una struttura dati di destinazione. Di fatto, la data virtualization fornisce un livello di astrazione al di sopra dell’implementazione fisica dei dati, per semplificare la logica delle query.

Come abbiamo avuto modo di descrivere nell’articolo “La virtualizzazione dei dati per una efficace data lineage”, le tecnologie di data virtualization devono essere vista come un “elemento facilitatore” della data governance, soprattutto in relazione all’efficacia che può portare nell’ambito della data lineage.

Le tecnologie di data virtualization e quelle di metadata management e data lineage, secondo l’esperienza di Bnova, sono oggi fondamentali per rispondere alle attuali esigenze delle aziende sul fronte della data governance, punto di partenza per tutte quelle organizzazioni che vogliano sviluppare processi in ottica data-driven.

 

Perché servono le tecnologie di data virtualization e metadata management

Il patrimonio informativo di un’azienda rappresenta il motore del suo business. Motore che ha bisogno di una fonte energetica per funzionare, i dati. Se questi dati non contengono informazioni corrette, di qualità, integre e consistenti, l’intero patrimonio risulta compromesso.

I dataset disponibili in azienda arrivano spesso da fonti eterogenee sia interne sia esterne all’azienda, con formati ed estensioni differenti, contenuti strutturati, in alcuni casi, e destrutturati e multimediali in altri (e-mail, conversazioni sui social network, documenti ma anche di immagini e di video).

In un sistema di data governance efficace si deve poter accedere con facilità e rapidità a qualsiasi tipo di fonte. Ed è qui che le tecnologie di data virtualization e quelle di metadata management assumono un ruolo cruciale.

Le tecnologie di data virtualization permettono di recuperare ed utilizzare i dati di qualsiasi forma e fonte, senza spostarli dalla loro origine. Si tratta di uno “strato” software posto tra le fonti di dati (che, come accennato, possono essere sia interne sia esterne alle aziende) e le diverse applicazioni aziendali che “consumano” i dati.

Le tecnologie di data virtualization, in pratica, portano i dati dove servono ma senza spostarli da dove sono, sfruttando la virtualizzazione come sistema di astrazione dei dati. Il software di virtualizzazione dei dati, quindi, non contiene alcun dato ma solo metadati necessari per consentire l’accesso alle varie fonti di dati.

Da qui si intuisce dunque l’importanza delle tecnologie di metadata management. Negli attuali contesti aziendali dove si è in presenza di data lake o di Big Data set, è divenuto ormai indispensabile corredare i dataset di tag e metadati che aiutano i sistemi a riconoscere rapidamente gli input, evitando ridondanze e selezionando ed attingendo ai dati quando servono nel modo più agile e semplice possibile.

La capacità di attribuire tag ai nuovi dati inseriti nei repository (metadata management) è essenziale per affrontare la complessità determinata dalla crescita esponenziale della mole di informazioni a disposizione delle piattaforme analitiche.

Infine, considerando la data lineage quale elemento essenziale di una buona data governance, perché in grado di mappare la discendenza dei dati e quindi di mostrare con chiarezza da dove i dati provengono, come si muovono all’interno dell’azienda, quali trasformazioni vengono loro applicate attraverso molteplici processi e come e quando escono dal patrimonio informativo aziendale, è evidente come la data lineage rappresenti oggi uno degli elementi di informazione più importanti proprio per il metadata management.

 

Le tecnologie di data virtualization targate Denodo

Secondo le più recenti recensioni pubblicate su Gartner Peer Insights (giudizi che costituiscono opinioni soggettive dei singoli utenti finali sulla base delle proprie esperienze, non quelle degli analisti della società americana di analisi e ricerche), tra le tecnologie di data virtualization spiccano quelle di Denodo.

Queste le motivazioni di alcuni utenti che stanno utilizzando le tecnologie di data virtualization di Denodo:

  • ottima piattaforma di virtualizzazione nel caso in cui sia necessario integrare origini dati eterogenee in tutta l’organizzazione e creare report in tempo reale senza duplicazione dei dati;
  • Denodo fornisce un data mart unificato per ottenere tutti i dati da diverse fonti in un unico posto;
  •  ottimo strumento di virtualizzazione dei dati, che consente agli utenti aziendali di connettere più big data warehouse nel cloud, importante per il self-service data discovery;
  • installazione e configurazioni semplificate e tool molto semplici da utilizzare;
  •  molteplici funzionalità self-service per sfruttare sia dati strutturati sia dati non strutturati.

 

Metadata management e data lineage con Erwin

Sempre attingendo alle recensioni degli utenti raccolte nei Gartner Peer Insights, nell’ambito della data governance, in particolare per le soluzioni tecnologiche di metadata management e di data lineage, spicca il nome di Erwin (by Quest).

Queste le motivazioni che hanno rilasciato alcuni degli utenti che hanno installato le tecnologie di Erwin:

  •  centralizzazione di un’enorme quantità di dati grazie un’interfaccia di elaborazione modulare che incorpora analisi dei dati, ingegneria aziendale, processi aziendali ed elaborazione dei dati;
  • software di data governace sicuro e “friendly”, ideale per mantenere il massimo livello di sicurezza dei dati;
  • ideale per data collection e modeling perché permette di avere informazioni precise su tutti i dati gestiti nell’organizzazione aziendale;
  • gestione efficace dei metadati (in ottica data lineage e data governance consente di sapere sempre dove sono archiviati i metadati);
  • ottimale per integrare i metadati da utilizzare nel lavoro di mappatura per la gestione del ciclo di vita dei dati, fornisce la derivazione automatizzata dei dati (tracciabilità) e le analisi degli impatti che determinati interventi possono causare sui dati.

Il fìl rouge che sembra legare le recensioni sia per le tecnologie di data virtualization sia per quelle di data governance è la consapevolezza che, di fronte alle nuove sfide di business ed a processi decisionali ed operativi che necessitano del dato quale elemento oggettivo, le soluzioni tecnologiche tradizionali (tra difficoltà di accesso ai dati, alti costi di gestione e integrazione, continue repliche dei dati per effettuare analisi, ecc.) risultano inefficaci e inadeguate. Ecco perché, dunque, sempre più serviranno le tecnologie di data virtualization, di metadata management, di data lineage e, in generale, data governance.

 

Per approfondire le potenzialità della Data Governance e della
Data Virtualization non perderti il live talk
Il caos dei dati: come Data Virtualizatione Data Governance ci salveranno dall’effetto farfalla” 🦋

New call-to-action

Approfondimenti da BNext:

Data Preparation: cos’è e come si esegue la preparazione dei dati

Data Preparation, una disciplina che si occupa di preparare i dati all’utilizzo che si intende effettuare in ambito aziendale. Vediamo cos’è

Cos’è la Data Governance e come implementarla efficacemente

I dati costituiscono la materia prima dell’azienda digitale. Implementarli e gestirli in maniera strategicamente efficiente si rivela fondamentale per successo di un business, ai fini di estrarre il maggior valore possibile in termini di informazioni utili a...

Erwin: dalla data governance alla data democratization

Democratizzazione del dato. Ne abbiamo parlato sotto tante declinazioni. Sicuramente una è quella legata alla Data Governance. Lo strumento leader per fare ciò è Erwin che permette di progettare e creare un’esperienza di organizzazione dati a livello aziendale.

Data Governance: governare processi e responsabilità sui dati. Un use case in ambito finance.

Secondo Gartner erwin by Quest è la soluzione di Data Governance leader di mercato. Ecco i vantaggi in un use case in ambito finance

La virtualizzazione dei dati per una efficace data lineage

La data virtualization come tecnologia di integrazione dati. Cos’è e perché è efficace per la data lineage

La data lineage nella Data Governance aziendale

Data lineage: l’origine dei dati, dove e come si spostano nel tempo. Consente di “mappare” tutto il ciclo di vita del dato.

erwin: l’acquisizione di Quest Software

Nel mondo IT molte sono le joint venture, è il caso di Quest, società software e servizi IT. erwin: l’acquisizione di Quest a dicembre 2020

Data Governance: superare i colli di bottiglia con erwin

La #DataGovernance è qualcosa di più della mera gestione del rischio: la conformità rispetto alle regolamentazioni in merito a queste tematiche è un valore aggiunto, ma la sua applicazione è spesso difficile a causa di una serie di colli di bottiglia che la frenano: data lineage assenti, qualità dei dati non certificata, contesto aziendale non pronto. Con erwin però puoi superarli!

Un framework per la Data Governance 2.0

La aziende hanno bisogno dei dati per prendere decisioni, la loro efficacia dipende anche dalla loro gestione. Scopri il framework per la Data Governance 2.0 per garantire l’accesso e uso dei dati in modo controllato e sicuro da chiunque ne abbia bisogno

Data Governance: come uscire dal caos e orchestrare al meglio i dati

La Data Governance è un insieme di strategie, processi e policy definite a monte della gestione e dell’utilizzo dei dati con l’obiettivo di gestirli per limitare rischi, prevenire errori, risolvere i problemi legati ai dati e alla loro (spesso) scarsa qualità