Attorno alla Data Science si sono sviluppate negli anni molte discipline affini e complementari ma che differiscono tra loro spesso in riferimento alla tipologia di analisi e di “lavoro” che viene condotto sui dati. Cerchiamo allora di capire come si è evoluta da Data Science e, soprattutto, come si è passati dalla Business Intelligence agli Advanced Analytics, in cosa differiscono e perché sono entrambi importanti per il processo decisionale nelle aziende.

Cos’è la Data Science e perché è una scienza multidisciplinare

La data science, in italiano la scienza dei dati, può essere definita come l’insieme delle discipline, delle tecniche e dei principi metodologici che si basano sul metodo scientifico necessari ad “osservare” i dati, ossia interpretarli, analizzarli ed estrarne informazioni e conoscenza utile (solitamente grazie al supporto di esperti chiamati data scientist).

Il termine Data Science fu coniato dall’informatico Peter Naur nel 1974: uso questo termine per la prima volta nel suo libro “Concise Survey of Computer Methods” per spiegare l’evoluzione dell’informatica verso una scienza più vicina ai dati, dapprima identificata dallo stesso Naur come “datalogy” e poi chiamata come tutti noi la conosciamo oggi, Data Science – scienza dei dati.

Inizialmente Naur intese la Data Science come la scienza (da intendersi come disciplina) legata alla gestione e alla manipolazione dei dati (quindi con una strettissima correlazione all’informatica tradizionali di quegli anni). A quell’epoca non c’era ancora l’enfasi sui temi del valore dei dati, quindi nella Data Science non rientravano approcci e strumenti metodologici (e tecnologici) per la loro analisi e interpretazione.

Dobbiamo attendere addirittura il 2001 per arrivare a vedere la Data Science non più come branca dell’informatica (della matematica e della statistica) ma come disciplina a sé. Il percorso è dovuto a William S. Cleveland (noto anche come Bill Cleveland), informatico americano e professore di statistica e di informatica, che suggerì di iniziare a vedere la Data Science come una disciplina complessa caratterizzata da differenti domini di competenza (ricerca multidisciplinare, modelli, elaborazione dati, pedagogia, valutazione degli strumenti e teoria dei dati). Da un punto di vista “tecnico”, nella visione di Cleveland, le aree tecniche della scienza dei dati sono quelle che hanno un impatto su come un Data Scientist, ossia un analista di dati, studia, esamina, scompone e analizza i dati: teoria statistica; modelli statistici; metodi statistici e di apprendimento automatico; algoritmi per metodi statistici e di apprendimento automatico e ottimizzazione; sistemi computazionali per l’analisi dei dati; analisi in tempo reale di dati in cui i risultati sono giudicati dai risultati, non dalla metodologia e dai sistemi utilizzati.

Il concetto di Data Science è poi evoluto ancora, soprattutto a seguito dell’evoluzione degli Analytics e all’avvento dei Big Data che hanno contribuito a “dare forma” ad una scienza multidisciplinare il cui principio di base non è la gestione del dato ma la sua valorizzazione.

Oggi la Data Science, pur mantenendo alcune peculiarità della sua definizione originale (ossia la trasversalità di discipline scientifiche: informatica, matematica e statistica), viene intesa come scienza multidisciplinare che richiede competenze più vicine al mondo del business, legate alle capacità di saper leggere, interpretare, comprendere e capitalizzare i dati per estrarne valore utile.

Per capire la “complessità” di questa scienza multidisciplinare, può venire in auto il diagramma che gli analisti di Gartner hanno pubblicato nel 2016 e che ben schematizza la concettualizzazione odierna di Data Science.

Data Science e Big Data Advanced Analytics

Dagli Advanced Analytics è poi evoluta la disciplina dei cosiddetti Big Data Advanced Analytics, termine usato per enfatizzare non tanto la diversità dei metodi di analisi dei dati quanto dalla “materia prima”, i Big Data anziché i dati “normali”.

Una definizione, seppur sommaria, di Big Data Advanced Analytics potrebbe dunque essere “la scienza dell’analisi predittiva di grandi molti di dati eterogenei (provenienti da molte fonti diverse) e di natura differente (dati strutturati e dati non strutturati) per la scoperta, l’interpretazione e la conoscenza di modelli significativi in tali moli di dati fondamentali per processi decisionali più efficaci”.

È evidente che i Big Data, in questa accezione, non rappresentano l’analisi in sé ma il “mezzo” che alimenta le analisi. Mezzo che ha meritato un posto in prima fila nella Data Science perché la natura stessa di questi dati, la velocità con cui aumentano ed evolvono, hanno inevitabilmente un impatto diretto e consistente sulla scienza dell’analisi dei dati.

Senza ripercorrere cosa sono i Big Data, di cui molto si è scritto, soprattutto in riferimento alle 3 V (Volume, Varietà, Velocità), poi divenute 5+1 (Volume, Varietà, Velocità, Veridicità, Variabilità + Valore), Data Science e Big Data Advanced Analytics sono oggi le due discipline (o meglio, quest’ultima l’espressione specifica e peculiare legata all’analisi predittiva dei dati della macro disciplina della scienza dei dati) che più riscuotono interesse da parte delle aziende.

Il perché è comprensibile guardando alla portata (ed al valore, soprattutto) dei Big Data stessi che consentono alle aziende – attraverso la loro corretta analisi ed interpretazione – di avere un patrimonio di informazioni e conoscenza utile per capire gli andamenti di mercati sempre più incerti e dinamici, intuire le “mosse” della concorrenza, comprendere esigenze (anche inespresse) e desideri degli utenti per migliorare engagement, fidelizzazione o ridurre i rischi di abbandono, gestire e mitigare i rischi finanziari e di business… e via dicendo.

In definitiva, le aziende oggi guardano con interesse agli Analytics perché hanno bisogno di strumenti (senza dimenticare processi, metodologie e approcci disciplinari, competenze) che possano aiutarle a prendere decisioni in modo più consapevole e oggettivo, basandosi sui dati. Perché hanno bisogno, in altri termini, di evolvere verso un modello data-driven enterprise.

 

Podcast BNova

Approfondimenti da BNext:

Eyes4Innovation, la rete che ti semplifica la vita

La rete ti semplifica la vita. Ecco la massima sintesi del motivo per cui è nata Eyes4Innovation, ed anche lo scopo ultimo perseguito dalle aziende fondatrici. Scopri com’è andato l’evento di presentazione.

Dataiku: le novità della release 9

Dataiku, tante novità. Le energie si concentrano sul processo di trasformazione e analisi del dato e sulla collaborazione con altri tool, come Tableau

Vertica apre le porte alla Data Science

La Data Science, in termini di supporto decisionale alle aziende, ha un potenziale enorme, ma è una materia molto ampia e di carattere sperimentale: non necessariamente l’algoritmo migliore per un settore si rivela buono anche in realtà aziendali...

Dataiku: Intelligenza Artificiale per le case farmaceutiche

Oltre il 60% delle aziende farmaceutiche sono state identificate come “principianti” quando si parla della loro maturità riguardo l’AI.

Data Science Tools: la cassetta degli attrezzi dei team di Data Scientist

Strumenti tecnologici, piattaforme, linguaggi di programmazione, tools di vario genere rappresentano elementi importanti, gli “attrezzi del mestiere” per i Data Scientist. Ecco alcuni dei linguaggi e dei tools che solitamente non mancano all’interno di un team di Data Scientist.

Data Scientist, chi sono e cosa fanno per aiutare le aziende

Oggi i dati rappresentano uno degli asset più critici ed importanti per un’azienda (e non solo), tant’è che ormai si parla dei dati come del nuovo petrolio nell’economia dell’informazione e della conoscenza. Chi lavora sui dati e con i dati gode di un grande vantaggio. Ma chi sono davvero i Data Scientist e cosa fanno concretamente per aiutare le aziende?

Dataiku: i consigli per scegliere il giusto progetto di Data Science

Con decine di potenziali use case ma risorse limitate, è importante dare priorità ai progetti che hanno sia un alto valore di business che un’alta probabilità di successo. I consigli di Dataiku

Le 6 (+1) fasi del processo tipico di Data Science

La Data Science è un campo di studi interdisciplinare il cui obiettivo finale è estrarre informazione e conoscenza utili da dati strutturati o non strutturati. Non esiste un framework unico e universalmente condivido per definire i processi di Data Science, tuttavia, dal punto di vista tecnico lo standard KDD è quello a cui ci si ispira maggiormente, perché indica l’intero processo di ricerca di nuova conoscenza dai dati.

RFM: le analisi sui clienti quali sistemi di supporto alle decisioni

Parliamo delle analisi RFM, pilastro di una data driven company. Sono analisi per la segmentazione della clientela e restituiscono valori ed informazioni utili che diventano la base per fare valutazioni strategiche e prendere decisioni più oggettive, basate sui dati.

Non voglio mica la Luna! L’arte di aver cura dei propri clienti

Oggi si sta creando un circuito virtuoso in cui il consumatore vuole un nuovo legame di fiducia. Il brand è chiamato a “reagire”, quindi fare tutto ciò che serve per soddisfare le necessità del cliente e soddisfare la sua “sete” di fiducia