Nell’era del digitale le organizzazioni necessitano di modelli e soluzioni affidabili per acquisire dati da molteplici fonti. Allo stesso tempo, i dati devono essere preparati per ottenere una qualità elevata, ai fini di garantire alle applicazioni analitiche di svolgere il loro lavoro con la sufficiente accuratezza previsionale.
L’infrastruttura dei dati di un’azienda digitale è il risultato di vari aspetti, che riguardano sia la tecnologia dei sistemi (data warehouse, data lake, ecc.) che i modelli organizzativi che contribuiscono ad una strategia di data management di successo, in cui, oltre alla performance, è necessario garantire la sicurezza e la protezione dei dati stessi.
In tale contesto, nel dibattito IT si parla sempre più spesso di data fabric. Vediamo nello specifico cos’è e come può aiutare le organizzazioni a generare un maggior valore aggiunto dall’utilizzo dei dati stessi.
Cos’è il data fabric
Secondo la definizione offerta da Techtarget, il data fabric è: “Un’architettura e una piattaforma software che offre una collezione unificata dei dati, dei database e dei sistemi di gestione all’interno di un’azienda. I data fabric possono essere limitati ad una singola applicazione, essere usati per raccogliere dati distribuiti e possono estendersi a tutti i dati aziendali. Il data fabric consiste nell’implementazione dei principi generali di virtualizzazione dei dati”.
In altri termini, il data fabric è un approccio di design finalizzato a integrare i dati e i loro processi di connessione, automatizzando le fasi relative alla trasformazione (ingestion, curation, discovery, preparation) e all’integrazione tra i data silos esistenti.
A livello funzionale, il data fabric crea di fatto un layer semantico che accelera la distribuzione, automatizzando i processi chiave per facilitare il lavoro dei dipendenti e degli analisti nelle fasi di preparazione dei dati.
Il data fabric non è specifico per un processo o per una particolare situazione di utilizzo, così come non è vincolato ad una piattaforma specifica. I suoi principi di design consentono a tutti i tipi di dati di essere facilmente utilizzati e gestiti grazie all’aggiunta di un layer funzionale che contiene informazioni di supporto per i sistemi di gestione dei dati, riducendo in questo modo la necessità di un’integrazione “point-to-point”.
Il data fabric supporta nativamente le più moderne tecnologie di analisi dei dati, consentendo l’impiego di funzioni di intelligenza artificiale e machine learning per trattare grandi numeriche di dati, provenienti da varie fonti e sistemi di gestione.
Come funziona
Il data fabric basa il proprio funzionamento sulla virtualizzazione delle risorse, andando a rompere il legame diretto che intercorre tra i dati e il sistema “fisico” che li vede coinvolti. Questo approccio, che consiste nell’astrazione delle risorse IT che coinvolgono i dati, consente di superare “per design” quello che viene definito il data silos.
Mediante il processo di virtualizzazione, il data fabric consente di unificare le basi di dati, automatizzare l’acquisizione da varie fonti e la loro preparazione, semplificando i processi di business intelligence e business analytics, per ottenere migliori insight a supporto del business aziendale.
I vantaggi di tale approccio, come vedremo nello specifico, partono da una miglior distribuzione dei dati a livello generale, che consente a tutte le linee di business di utilizzarli in maniera sinergica ed integrata.
A livello funzionale, il data fabric facilita l’implementazione di un ambiente di dati distribuito, mediante una serie di operazioni specifiche:
- Gestione di dati in ambienti IT ibridi (on-premise, cloud pubblico / multicloud, cloud privato)
- Collegamento ad una enorme varietà di sorgenti di dati, grazie a connettori e componenti sviluppati appositamente per tale scopo, evitando di dover scrivere del codice ogni volta che si presenta la necessità di aggiungere una fonte.
- Supporto dei dati non strutturati e delle tecnologie real-time, come le applicazioni in streaming di contenuti multimediali.
- Funzioni di ingestione e integrazione dei dati tra due o più sorgenti e applicazioni.
- Funzioni di supporto alla data preparation e alla data quality supportate da processi di automazione basati sul machine learning.
- Integrazione nei sistemi esistenti grazie al supporto delle API
Il data fabric prevede il coinvolgimento di stakeholder più o meno tecnici: dipendenti delle linee di business, analisti, data engineer, ecc. mettendo a disposizione di ognuno di loro i dati utili per lo svolgimento delle loro attività, ai fini di superare i tradizionali data silos e favorire l’innovazione in azienda.
Quali sono i vantaggi
Se correttamente implementato, iI data fabric è in grado di generare vantaggi sia di carattere operativo che organizzativo. Tra i più rilevanti a livello strategico, è opportuno citare:
Superamento dei data silos
I database tendono ad essere implementati dalle varie linee di business e a crescere di dimensione e numero nel corso del tempo, rendendo di fatto l’inventario aziendale più complicato ed oneroso da gestire.
A livello funzionale, tendono a crearsi dei data silos, che rendono problematica la comunicazione dei dati tra le varie linee aziendali, limitando le potenzialità della loro fruizione sia a livello operativo che a livello strategico. Uno degli aspetti più evidenti per riconoscere la presenza di un silos è ad esempio la presenza di dati con strutture e formati diversi, per cui non è previsto un quadro di interoperabilità.
In base al suo funzionamento, il data fabric astrae le risorse IT e le rende disponibili grazie alla virtualizzazione, per cui supera nativamente i problemi legati ai data silos, facilitando vari aspetti dell’utilizzo dei dati, dalle query ad una maggior visibilità a livello generale.
Unificare le basi di dati
Grazie alla virtualizzazione, il data fabric può unificare la base di dati, superando le limitazioni di accesso tradizionalmente dovute a differenti sistemi di storage e gestione, collocati presso differenti data center, spesso difficilmente accessibili da remoto, anche per via delle policy legate al loro utilizzo.
Il data fabric facilita l’integrazione dei vari sistemi attraverso le API, uno strumento molto agile che consente agli sviluppatori di ottimizzare l’utilizzo di dati specifici, rendendoli più o meno accessibili verso altre applicazioni, oppure per unificare i dati contenuti nei vari silos.
Garantire l’accesso ai dati in maniera ibrida
Il data fabric consolida e astrae le risorse contenute in cloud e on-premise, rendendole disponibili allo stesso modo per le applicazioni grazie alla virtualizzazione. Ne consegue che il data fabric può essere assunto come un utile asset per migliorare la portabilità e il cloudbursting delle applicazioni stesse, oltre ad automatizzare i processi di backup del componenti in cloud nel data center proprietario.
Alcuni esempi di utilizzo
Il data fabric trova efficacemente luogo in vari ambiti applicativi. Vediamo alcuni dei contesti più rilevanti:
AI, real time e advanced analytics
Attraverso l’automazione e l’impiego di funzioni basate sull’intelligenza artificiale, il data fabric facilita lo svolgimento di analisi avanzate in tempo reale, come quelle implementate nel rilevamento delle frodi, nella gestione dei rischi e nel funzionamento dei sistemi di sicurezza. Si tratta di ambiti in cui risulta decisiva la capacità di rilevare pattern anomali nella condizione che tecnicamente viene definita “near real time”, ossia veloce al punto da essere assimilabile al tempo reale.
(Industrial) Internet of Things (Iot)
I sensori dei sistemi IoT consentono di acquisire enormi quantità di dati in tempo reale. Il data fabric consente di archiviarli, elaborarli e renderli disponibili per le applicazioni di business intelligence e business analytics, utilizzando funzioni basate sull’intelligenza artificiale e il machine learning.
Il data fabric facilita i processi analitici integrandosi ad esempio con i data lake, che tra i sistemi di gestione dei dati risultano molto congeniali per le applicazioni IoT, grazie alla capacità di collezionare i dati senza doverli preventivamente preparare per l’analisi.
Conoscenza dei clienti
Grazie alla capacità di unificare le basi di dati, il data fabric consente alle organizzazioni di riconoscere in maniera incredibilmente puntuale tutte le caratteristiche riguardanti i consumatori, per valutare la loro soddisfazione e prevedere con precisione il churn rate, attivando di conseguenza una serie di attività utili a contrastare l’abbandono.
Basandosi su logiche simili, il data fabric agevola molte attività basate sulla conoscenza dei clienti, come la formazione di gruppi omogenei da utilizzare nelle applicazioni marketing e la personalizzazione delle offerte per i team di vendita.
Conoscenza del business
il data fabric è in grado di tracciare con facilità una mappa delle anomalie, dei punti di flesso e dei risultati di business di un’azienda. Per queste ragioni, viene utilizzato per applicazioni di business intelligence e business analytics utili a comprendere al meglio gli andamenti e ottimizzare le performance dell’organizzazione sotto vari punti di vista.
Data fabric o data mesh?
Nell’ambito della varietà e della complessità offerta dall’attuale mondo IT, il data management sta diventando una vera e propria arte, che gli stakeholder quotidianamente impegnati a dare forma all’architettura più congeniale per i bisogni presenti e futuri dell’organizzazione.
In questo contesto emergono discipline come data fabric e data mesh, in grado di offrire modelli e approcci differenti per risolvere problemi molto spesso simili e comuni alla situazione IT della maggior parte delle aziende.
Data fabric e data mesh, una volta implementati, possono apparire molto simili tra loro, al punto che vengono sovente usati in maniera complementare nell’ambito delle strategie di data management. Tuttavia, la loro genesi teorica e applicativa si basa su presupposti del tutto differenti.
Dopo aver a lungo trattato i tratti essenziali del data fabric, possiamo evidenziare come il data mesh sia fondato su alcuni principi fondamentali, che vanno oltre il fatto tecnologico, con l’obiettivo di mettere i dati a disposizione di tutti gli stakeholder, non soltanto di quelli più tecnici:
- Architettura dei dati decentralizzata e domain-oriented
- Infrastruttura dei dati basata su una piattaforma self-service
- Logica “data as a product”
È pertanto evidente come data fabric e data mesh forniscano un’architettura che consente di accedere ai dati utilizzando varie tecnologie e piattaforme, ma il primo è incentrato soprattutto sulla tecnologia, mentre il secondo parte dal cambiamento del modello organizzativo.
Tecnicamente, la differenza di approccio si concretizza in un diverso utilizzo delle API. Concettualmente il data mesh si focalizza più sulle persone e i processi, mentre il data fabric, pur coinvolgendo in maniera adeguata tali fattori, risulta molto più incentrato sulle caratteristiche dell’architettura, soprattutto per quanto concerne la gestione di dati e metadati per facilitare l’integrazione a 360°.
Categoria: DATA GOVERNANCE

Data Lineage: come assicurarsi qualità e integrità dei dati
Tracciare i dati attraverso il loro ciclo di vita è un tema di valenza strategica.… Leggi tutto

Cos’è la Data Quality e le metriche di riferimento
La Data Quality è una misura della condizione dei dati basata su fattori quali accuratezza,… Leggi tutto

Data as a Service: cos’è a cosa serve
I modelli a servizi disponibili in cloud consentono di avere nuove opzioni di utilizzo dei… Leggi tutto