Attorno alla Data Science si sono sviluppate negli anni molte discipline affini e complementari ma che differiscono tra loro spesso in riferimento alla tipologia di analisi e di “lavoro” che viene condotto sui dati. Cerchiamo allora di capire come si è evoluta da Data Science e, soprattutto, come si è passati dalla Business Intelligence agli Advanced Analytics, in cosa differiscono e perché sono entrambi importanti per il processo decisionale nelle aziende.

Cos’è la Data Science e perché è una scienza multidisciplinare

La data science, in italiano la scienza dei dati, può essere definita come l’insieme delle discipline, delle tecniche e dei principi metodologici che si basano sul metodo scientifico necessari ad “osservare” i dati, ossia interpretarli, analizzarli ed estrarne informazioni e conoscenza utile (solitamente grazie al supporto di esperti chiamati data scientist).

Il termine Data Science fu coniato dall’informatico Peter Naur nel 1974: uso questo termine per la prima volta nel suo libro “Concise Survey of Computer Methods” per spiegare l’evoluzione dell’informatica verso una scienza più vicina ai dati, dapprima identificata dallo stesso Naur come “datalogy” e poi chiamata come tutti noi la conosciamo oggi, Data Science – scienza dei dati.

Inizialmente Naur intese la Data Science come la scienza (da intendersi come disciplina) legata alla gestione e alla manipolazione dei dati (quindi con una strettissima correlazione all’informatica tradizionali di quegli anni). A quell’epoca non c’era ancora l’enfasi sui temi del valore dei dati, quindi nella Data Science non rientravano approcci e strumenti metodologici (e tecnologici) per la loro analisi e interpretazione.

Dobbiamo attendere addirittura il 2001 per arrivare a vedere la Data Science non più come branca dell’informatica (della matematica e della statistica) ma come disciplina a sé. Il percorso è dovuto a William S. Cleveland (noto anche come Bill Cleveland), informatico americano e professore di statistica e di informatica, che suggerì di iniziare a vedere la Data Science come una disciplina complessa caratterizzata da differenti domini di competenza (ricerca multidisciplinare, modelli, elaborazione dati, pedagogia, valutazione degli strumenti e teoria dei dati). Da un punto di vista “tecnico”, nella visione di Cleveland, le aree tecniche della scienza dei dati sono quelle che hanno un impatto su come un Data Scientist, ossia un analista di dati, studia, esamina, scompone e analizza i dati: teoria statistica; modelli statistici; metodi statistici e di apprendimento automatico; algoritmi per metodi statistici e di apprendimento automatico e ottimizzazione; sistemi computazionali per l’analisi dei dati; analisi in tempo reale di dati in cui i risultati sono giudicati dai risultati, non dalla metodologia e dai sistemi utilizzati.

Il concetto di Data Science è poi evoluto ancora, soprattutto a seguito dell’evoluzione degli Analytics e all’avvento dei Big Data che hanno contribuito a “dare forma” ad una scienza multidisciplinare il cui principio di base non è la gestione del dato ma la sua valorizzazione.

Oggi la Data Science, pur mantenendo alcune peculiarità della sua definizione originale (ossia la trasversalità di discipline scientifiche: informatica, matematica e statistica), viene intesa come scienza multidisciplinare che richiede competenze più vicine al mondo del business, legate alle capacità di saper leggere, interpretare, comprendere e capitalizzare i dati per estrarne valore utile.

Per capire la “complessità” di questa scienza multidisciplinare, può venire in auto il diagramma che gli analisti di Gartner hanno pubblicato nel 2016 e che ben schematizza la concettualizzazione odierna di Data Science.

Data Science e Big Data Advanced Analytics

Dagli Advanced Analytics è poi evoluta la disciplina dei cosiddetti Big Data Advanced Analytics, termine usato per enfatizzare non tanto la diversità dei metodi di analisi dei dati quanto dalla “materia prima”, i Big Data anziché i dati “normali”.

Una definizione, seppur sommaria, di Big Data Advanced Analytics potrebbe dunque essere “la scienza dell’analisi predittiva di grandi molti di dati eterogenei (provenienti da molte fonti diverse) e di natura differente (dati strutturati e dati non strutturati) per la scoperta, l’interpretazione e la conoscenza di modelli significativi in tali moli di dati fondamentali per processi decisionali più efficaci”.

È evidente che i Big Data, in questa accezione, non rappresentano l’analisi in sé ma il “mezzo” che alimenta le analisi. Mezzo che ha meritato un posto in prima fila nella Data Science perché la natura stessa di questi dati, la velocità con cui aumentano ed evolvono, hanno inevitabilmente un impatto diretto e consistente sulla scienza dell’analisi dei dati.

Senza ripercorrere cosa sono i Big Data, di cui molto si è scritto, soprattutto in riferimento alle 3 V (Volume, Varietà, Velocità), poi divenute 5+1 (Volume, Varietà, Velocità, Veridicità, Variabilità + Valore), Data Science e Big Data Advanced Analytics sono oggi le due discipline (o meglio, quest’ultima l’espressione specifica e peculiare legata all’analisi predittiva dei dati della macro disciplina della scienza dei dati) che più riscuotono interesse da parte delle aziende.

Il perché è comprensibile guardando alla portata (ed al valore, soprattutto) dei Big Data stessi che consentono alle aziende – attraverso la loro corretta analisi ed interpretazione – di avere un patrimonio di informazioni e conoscenza utile per capire gli andamenti di mercati sempre più incerti e dinamici, intuire le “mosse” della concorrenza, comprendere esigenze (anche inespresse) e desideri degli utenti per migliorare engagement, fidelizzazione o ridurre i rischi di abbandono, gestire e mitigare i rischi finanziari e di business… e via dicendo.

In definitiva, le aziende oggi guardano con interesse agli Analytics perché hanno bisogno di strumenti (senza dimenticare processi, metodologie e approcci disciplinari, competenze) che possano aiutarle a prendere decisioni in modo più consapevole e oggettivo, basandosi sui dati. Perché hanno bisogno, in altri termini, di evolvere verso un modello data-driven enterprise.

 

Podcast BNova


Approfondimenti da BNext:

Prevenire l’abbandono dei clienti: le churn analysis in Niky

Le churn analysis sono analisi avanzate dei dati che non solo offrono una previsione della tendenza all’abbandono da parte dei clienti, ma consente di trarre efficaci strategie per migliorare la Customer eXperience.

Niky Analytics, analisi avanzate dei dati per il Retail Marketing

Gli analytics nel retail: Niky Analytics per migliorare l’esperienza del cliente, aumentare le vendite e ottimizzare le operations

Dataiku: le novità della release 9

Dataiku, tante novità. Le energie si concentrano sul processo di trasformazione e analisi del dato e sulla collaborazione con altri tool, come Tableau

Predictive Analytics nel Retail marketing, i casi d’uso

Retail marketing, i casi d’uso delle predictive analytics. Alcuni esempi applicativi delle analisi predittive nell’ambito del Retail marketing

Retail Analytics, la Data Science applicata al settore del commercio

Cosa sono i Retail Analytics, a cosa servono e per chi sono utili. Scopri come sfruttare al meglio la Retail Data Analysis

Dataiku: Intelligenza Artificiale per le case farmaceutiche

Oltre il 60% delle aziende farmaceutiche sono state identificate come “principianti” quando si parla della loro maturità riguardo l’AI.

denodo: quando la Data Virtualization fa la differenza

La data virtualization è trasversale e può fare la differenza in quelle situazioni in cui i dati sono su diverse fonti da integrare

Le analisi di coorte integrate in Niky, la piattaforma di Customer Analytics di BNova

Nelle analisi di coorte integrate in Niky puoi osservare l’evoluzione nel tempo delle coorti acquisendo informazioni di valore per il business

Data Virtualization: a chi porta i maggiori benefici?

I vantaggi e benefici che la Data Virtualization porta in azienda riguardano tutti i data consumer, ciascuno in modo diverso. Vediamo per le diverse funzioni aziendali, quali sono i benefici più evidenti.

Analisi di coorte: cos’è e perché è importante per capire il comportamento degli utenti

L’analisi di coorte è una tipologia di analisi dei dati che si concentra sulle attività ed il comportamento di una specifica coorte, ossia un gruppo di persone che condividono una o più caratteristiche comuni in un dato periodo di tempo.