BIG
DATA PLATFORM

#1 Rule

Le Piattaforme Big Data al Servizio del Business

I dati devono essere memorizzati in strutture adeguate a quelle che sono le loro finalità di utilizzo e devono essere supportati da architetture che ne garantiscano le perfomance in funzione di: volumi trattati, utenti collegati, luogo di collegamento modalità di acquisizione e fruizione del dato, real-time, near real-time…

Il primo step puramente IT per avviare un’azienda verso un percorso data driven, sta proprio nel disegno adeguato delle architetture e nella scelta oculata dei sistemi di storage del dato, a tale scopo è molto importante creare queste fondamenta in funzione di quello che sarà il loro utilizzo futuro ovvero pensando da subito a supportare l’uso del dato in funzione degli obiettivi di business.

#2 Rule

La Tecnica Dipende dal Dato e dal Suo Utilizzo

Data Virtualization

Possedete diversi data silos, sia in ambienti analitici che operativi, stratificati nel tempo? La Data Virtualization può essere una giusta soluzione, essa fornisce un approccio agile e moderno all’integrazione dei dati: li lascia nei sistemi di origine, esponendo semplicemente una vista integrata di tutti i dati a chi li utilizza.

Man mano che gli utenti aziendali utilizzano i report, la virtualizzazione recupera i dati in tempo reale dai sistemi di origine sottostanti, indipendentemente da: infrastruttura, sistemi di storage e database. La Data Virtualization crea infatti un data layer logico che integra tutti i dati aziendali archiviati in sistemi diversi, consente di gestirli in maniera unificata centralizzando la gestione della sicurezza e la governance e, al contempo, li mette a disposizione di tutti gli utenti aziendali in tempo reale.

Internet of Things Platform

L’IOT è un fenomeno è destinato a rivoluzionare il mondo dell’industria in qualsiasi settore: tecnologie di ultima generazione quali reti di sensori, attuatori, RFID, protocolli wireless e real time location systems permettono un costante controllo su qualsiasi oggetto o processo, permettendo di intervenire tempestivamente in caso di necessità, di ridurre drasticamente inefficienze piuttosto che creare nuovi servizi legati ai prodotti fisici che vengono venduti.

Una piattaforma IoT è una tecnologia multi-layer che consente il provisioning, la gestione e l’automazione di tutti i dispositivi connessi all’interno dell’universo dell’Internet of Things. Riunendo i livelli hardware, di connettività, software e quello applicativo costituisce una soluzione efficiente anche per la raccolta e l’analisi dei dati, la creazione di applicazioni e la connessione con il cloud o server on site.

Definire la user experience: quali sono le abitudini di acquisto del mio cliente?

Le aziende hanno necessità di utilizzare i dati per prendere decisioni, tuttavia i dati si trovano spesso in silos separati e con formati e codifiche differenti. Come possiamo farli parlare tra loro? La Data Ingestion è un insieme di processi sui dati provenienti da diverse sorgenti, finalizzata a fornire all’utente una visione unificata e più agile.

I dati possono essere inseriti in tempo reale, in batch o in una combinazione dei due (architettura lambda). La scelta dipende dal dato che deve essere trattato; l’Ingestion in tempo reale è utile, ad esempio, quando le informazioni raccolte sono molto sensibili al fattore tempo, come i dati di una rete elettrica, o quelli atti ad intercettare le frodi connesse ai sistemi di pagamento o di Cyber Security.

Data Lake, Data Hub e Data Warehouse

Mi serve un Data Lake o un Data Hub? Cosa devo fare con il mio Data Warehouse? Non esiste una risposta unica, in generale si tratta di elementi che possono essere anche coesistere perché ognuno ha una sua specificità: il Data Warehouse contiene dati integrati, certificati e strutturati provenienti da più fonti, utilizzati per la creazione di report e l’analisi istituzionale, destinato quindi ad un ampio numero di utenti.

Il Data Lake è l’archivio unico di tutti i dati aziendali strutturati e non strutturati, ospita dati non certificati, è quindi un ambiente sempre a supporto dell’analisi dati ma destinato a sistemi di analisi avanzata e ad un numero ridotto di utenti, tipicamente Data Scientist.

Il Data Hub è l’ambiente di gestione, sincronizzazione e archiviazione delle informazioni condivise, in grado di garantirne l’accesso da qualsiasi front-end e lo scambio tra le diverse applicazioni, nei formati necessari ad ognuna. Si tratta di un ambiente che migliora l’efficienza operativa e rende agile l’azienda, spesso usato per la Data Governance e tipicamente non destinato ad utenti finali ma ad applicazioni.

#3 Rule

Quale scegliere?

La tecnologia non è mai fine a sé stessa, deve essere inserita in un contesto di business in cui il perseguimento degli obiettivi strategici sia l’unica linea guida da adottare, anche per le scelte tecnologiche. Non esiste quindi un software o un’architettura che, a priori, possano essere considerate le migliori, occorre sempre tenere presente da chi (Who), perché (Why) , quando (When) e dove (Where) verranno usati i dati per decidere cosa scegliere.

Esistono tuttavia delle caratteristiche generali che è bene tenere presente quando si disegna una Big Data Platform: si tratta di sistemi con volumi destinati a crescere nel tempo, quindi, devono essere altamente scalabili per garantire sempre performance adeguate; inoltre sono destinati ad interfacciarsi, nel tempo, con un numero sempre maggiore di applicativi è quindi preferibile che si tratti di sistemi aperti, cioè che possano facilmente integrarsi con altri sistemi o perché Open o perché dotati di semplici sistemi di customizzazione; infine devono essere sistemi multipiattaforma, che consentano, quindi, il deploy su sistemi cloud, ibridi o on-premise.

MASSA

VIA MASSA AVENZA N. 38

0585 842210

ROMA

VIA FILIPPO TOMMASO MARINETTI N. 221

06 97620524

MILANO

LARGO RICHINI N. 6

02 58215555