La Data Science si sta imponendo come un potente acceleratore di business, in grado di aprire la strada a nuove interessanti applicazioni: dalla churn analysis per prevenire l’abbandono dei clienti, alla fraud detection per individuare gli illeciti finanziari, fino alla predictive manteinance per anticipare guasti e fermi macchina. Tuttavia, la capacità di ottimizzare i processi aziendali grazie alla Data Science richiede un alto livello di competenza diffusa all’interno dell’azienda e strumenti in grado di semplificare la realizzazione di progetti complessi.

In questo contesto si inserisce la piattaforma di Data Science collaborativa Dataiku, offerta in Italia da Bnova, società di consulenza IT con sede a Massa, Roma e Milano, specializzata in soluzioni legate all’analisi delle informazioni. Dataiku infatti è in grado di gestire un intero progetto di Data Science: dalla definizione e preparazione dei dataset allo sviluppo e gestione dei modelli di calcolo, fino alla creazione di dashboard per la visualizzazione delle informazioni e report per il monitoraggio dei risultati.

 

Data science collaborativa per qualsiasi professione

 

La dimensione “collaborativa” si riferisce proprio all’estrema flessibilità della piattaforma, che grazie all’ampio raggio di azione risolve le esigenze di figure professionali differenti (tecniche e di business), permettendo la cooperazione sulle iniziative analitiche.

Il Business Analyst beneficia dell’interfaccia grafica intuitiva per sperimentare nuovi orizzonti applicativi senza competenze informatiche specifiche, attraverso semplici funzionalità drag & drop; il Data & It Engineer sfrutta i più avanzati tools per supervisionare le attività della piattaforma e degli utenti, ha la possibilità di utilizzare algoritmi già presenti sulla piattaforma o di svilupparne di nuovi e più customizzati, ad esempio, con l’integrazione con R o in Python. Grazie all’automazione delle attività più ripetitive e time-consuming (ad esempio, la pulizia del codice dalle ridondanze), il Data Scientist può presidiare l’intero processo di analisi, concentrandosi sullo sviluppo dei modelli; l’Analytics Leader senza particolare background tecnico dispone di strumenti per una data visualization intuitiva, il controllo delle performance e la presentazione dei risultati agli stakeholder.

 

Tutte le funzionalità di Dataiku in dettaglio

 

Ma quali sono le funzionalità di Dataiku e come riescono a coprire l’intera gestione dei progetti di machine learning?

Innanzitutto, si parte dalla data preparation ovvero dalla selezione delle fonti e dalla definizione dei flussi di trasformazione delle informazioni. Operazioni tipiche sono reduction, sampling, gestione dei valori anomali o mancanti. Dataiku permette di svolgere le attività di data cleaning sia attraverso procedure preimpostate o l’utilizzo di scripting con codice personalizzato.

La creazione dei modelli di machine learning può avvenire attraverso processi guidati step-by-step, che sfruttano librerie di ultima generazione come Scikit-Learn, MLlib e XGboost e funzionalità di scripting con inserimento manuale di codice nei diversi linguaggi (ad esempio, Python o R).

La data visualization è una componente fondamentale della piattaforma, che include un vasto assortimento di grafici e mappe native con la possibilità di aggiungere plugin esterni per avere ulteriori alternative.

In pochi click, Dataiku permette di migrare facilmente i progetti dall’ambiente di sviluppo alla produzione: per ogni progetto in fase di development è infatti possibile creare dei bundle aggiornati all’ultima versione per il deploy immediato.

La piattaforma offre infine funzioni di monitoraggio per tenere sotto controllo l’esecuzione dei diversi processi, verificando le performance degli algoritmi di machine learning per il loro aggiornamento e manutenzione.

 

I vantaggi di business dall’uso di Dataiku

 

Inutile dire che la Data Science rappresenterà sempre di più una leva competitiva irrinunciabile per qualsiasi azienda, ma l’attuale shortage di competenze specifiche costituisce un ostacolo allo sviluppo dei progetti. Da qui la necessità di una piattaforma completa e di semplice utilizzo per concretizzare le strategie data-driven delle imprese.

Introducendo le funzionalità di Data Science si possono affinare le azioni di marketing e aumentare i profitti, grazie alle analisi che permettono di conoscere e profilare i clienti, realizzare campagne mirate, prevenire gli abbandoni, migliorare le attività di up selling e cross selling.

 

Velocità di produzione

Contemporaneamente, il machine learning permette di recuperare efficienza e tagliare sui costi grazie all’automazione e ottimizzazione dei processi (si pensi alla manutenzione predittiva o al controllo della supply chain). Il personale aziendale viene quindi dispensato dalle operazioni più ripetitive e dispendiose in termini di tempo, potendosi dedicare ad attività a maggiore valore.

 

Scopri le novità di Dataiku 9 e l’integrazione con Tableau nel webinar

  

New call-to-action

Approfondimenti da BNext:

Data Science Lifecycle, le 6 (+1) fasi del processo

La Data Science è un campo di studi interdisciplinare il cui obiettivo finale è estrarre informazione e conoscenza utili da dati strutturati o non strutturati. Non esiste un framework unico e universalmente condivido per definire i processi di Data Science, tuttavia, dal punto di vista tecnico lo standard KDD è quello a cui ci si ispira maggiormente, perché indica l’intero processo di ricerca di nuova conoscenza dai dati.

A cosa serve la Data Science?

L’analisi dei dati è in generale una materia molto ampia e con una storia che rimanda indietro di diversi anni da oggi. Si inizia a parlare di analisi dati già alla fine del 1700 con le prime visualizzazioni grafiche e l’evoluzione di questa materia non solo negli...

Churn Strategy: gli step per impostarla al meglio minimizzando il Churn Rate

Churn analysis e churn rate sono due concetti strettamente connessi: l’analisi degli abbandoni (churn analysis) è quella branca della Data Science attraverso cui si cerca di prevedere quali clienti hanno maggiori probabilità di abbandonare l’azienda, cosa che si...

I 6 comandamenti per un Data Storytelling di successo 

Letteralmente il Data Storytelling è l’arte del raccontare una storia attraverso i dati. Si tratta dell’evoluzione della Data Visualization, l’ultimo step di quel lungo processo analitico che ha lo scopo di trasformare i dati provenienti dalle diverse origini di...

Cosa sono i Big Data e come vengono utilizzati?

I Big Data sono ormai entrati a far parte del mercato tecnologico globale, ma spesso questa definizione viene utilizzata senza aver chiaro di cosa si tratta o di quali sono le accortezze e le tecnologie necessarie per poterli sfruttare al meglio nel loro valore...

Chi è e quanto guadagna un Data Engineer?

Fino a qualche tempo fa occuparsi dell’analisi dati in azienda voleva dire fare BI, e non era difficile trovare figure che si occupassero di questo. Nell’ultimo decennio, invece, l’analisi dati si è evoluta in modo esponenziale, si inizia a parlare di Data Science,...

Eyes4Innovation, la rete che ti semplifica la vita

La rete ti semplifica la vita. Ecco la massima sintesi del motivo per cui è nata Eyes4Innovation, ed anche lo scopo ultimo perseguito dalle aziende fondatrici. Scopri com’è andato l’evento di presentazione.

Dataiku e Data Exploration: chi è il miglior detective della serie “Scooby-doo”?

Dataiku e la data exploration, il primo passo per impostare i progetti nel modo più adatto è esplorare i dati e imparare a conoscerli.

Dataiku viene lanciato in AWS Marketplace

Tutti i clienti AWS potranno accedere a Dataiku e sfruttare la potenza dell’AI: infatti Dataiku adesso è disponibile sul marketplace AWS.

Denodo e la data virtualization a supporto di Machine Learning e Data Science

Il Machine Learning e la Data science sono strettamente legate alla data virtualization. denodo è il tool ideale individuato da BNova