La Data Science si sta imponendo come un potente acceleratore di business, in grado di aprire la strada a nuove interessanti applicazioni: dalla churn analysis per prevenire l’abbandono dei clienti, alla fraud detection per individuare gli illeciti finanziari, fino alla predictive manteinance per anticipare guasti e fermi macchina. Tuttavia, la capacità di ottimizzare i processi aziendali grazie alla Data Science richiede un alto livello di competenza diffusa all’interno dell’azienda e strumenti in grado di semplificare la realizzazione di progetti complessi.

In questo contesto si inserisce la piattaforma di Data Science collaborativa Dataiku, offerta in Italia da Bnova, società di consulenza IT con sede a Massa, Roma e Milano, specializzata in soluzioni legate all’analisi delle informazioni. Dataiku infatti è in grado di gestire un intero progetto di Data Science: dalla definizione e preparazione dei dataset allo sviluppo e gestione dei modelli di calcolo, fino alla creazione di dashboard per la visualizzazione delle informazioni e report per il monitoraggio dei risultati.

Data science collaborativa per qualsiasi professione

La dimensione “collaborativa” si riferisce proprio all’estrema flessibilità della piattaforma, che grazie all’ampio raggio di azione risolve le esigenze di figure professionali differenti (tecniche e di business), permettendo la cooperazione sulle iniziative analitiche.

Il Business Analyst beneficia dell’interfaccia grafica intuitiva per sperimentare nuovi orizzonti applicativi senza competenze informatiche specifiche, attraverso semplici funzionalità drag & drop; il Data & It Engineer sfrutta i più avanzati tools per supervisionare le attività della piattaforma e degli utenti, ha la possibilità di utilizzare algoritmi già presenti sulla piattaforma o di svilupparne di nuovi e più customizzati, ad esempio, con l’integrazione con R o in Python. Grazie all’automazione delle attività più ripetitive e time-consuming (ad esempio, la pulizia del codice dalle ridondanze), il Data Scientist può presidiare l’intero processo di analisi, concentrandosi sullo sviluppo dei modelli; l’Analytics Leader senza particolare background tecnico dispone di strumenti per una data visualization intuitiva, il controllo delle performance e la presentazione dei risultati agli stakeholder.

Tutte le funzionalità di Dataiku in dettaglio

Ma quali sono le funzionalità di Dataiku e come riescono a coprire l’intera gestione dei progetti di machine learning?

Innanzitutto, si parte dalla data preparation ovvero dalla selezione delle fonti e dalla definizione dei flussi di trasformazione delle informazioni. Operazioni tipiche sono reduction, sampling, gestione dei valori anomali o mancanti. Dataiku permette di svolgere le attività di data cleaning sia attraverso procedure preimpostate o l’utilizzo di scripting con codice personalizzato.

La creazione dei modelli di machine learning può avvenire attraverso processi guidati step-by-step, che sfruttano librerie di ultima generazione come Scikit-Learn, MLlib e XGboost e funzionalità di scripting con inserimento manuale di codice nei diversi linguaggi (ad esempio, Python o R).

La data visualization è una componente fondamentale della piattaforma, che include un vasto assortimento di grafici e mappe native con la possibilità di aggiungere plugin esterni per avere ulteriori alternative.

In pochi click, Dataiku permette di migrare facilmente i progetti dall’ambiente di sviluppo alla produzione: per ogni progetto in fase di development è infatti possibile creare dei bundle aggiornati all’ultima versione per il deploy immediato.

La piattaforma offre infine funzioni di monitoraggio per tenere sotto controllo l’esecuzione dei diversi processi, verificando le performance degli algoritmi di machine learning per il loro aggiornamento e manutenzione.

I vantaggi di business dall’uso di Dataiku

Inutile dire che la Data Science rappresenterà sempre di più una leva competitiva irrinunciabile per qualsiasi azienda, ma l’attuale shortage di competenze specifiche costituisce un ostacolo allo sviluppo dei progetti. Da qui la necessità di una piattaforma completa e semplice utilizzo per concretizzare le strategie data-driven delle imprese.

Introducendo le funzionalità di Data Science si possono affinare le azioni di marketing e aumentare i profitti, grazie alle analisi che permettono di conoscere e profilare i clienti, realizzare campagne mirate, prevenire gli abbandoni, migliorare le attività di up selling e cross selling.

Velocità di produzione

Contemporaneamente, il machine learning permette di recuperare efficienza e tagliare sui costi grazie all’automazione e ottimizzazione dei processi (si pensi alla manutenzione predittiva o al controllo della supply chain). Il personale aziendale viene quindi dispensato dalle operazioni più ripetitive e dispendiose in termini di tempo, potendosi dedicare ad attività a maggiore valore.

New call-to-action