A collaborative data science platform for Clickers and Coders, productive and scalable on your IT

Dataiku è una piattaforma di data science collaborativa che copre tutta la filiera dalla creazione di un processo di analisi, passando per la definizione del dataset fino ad arrivare alla creazione della reportistica. Dataiku è in grado di gestire un intero progetto di machine learning: dalla data preparation, fino allo studio e all’applicazione di modelli di mining descrittivi e predittivi, compresa la creazione di dashboard per la visualizzazione finale dei dati.

I professionisti BNova sono certificati
Dataiku DSS

 

#BIG-DATA #DATA-ANALYTICS #PREDICTIVE-ANALYSIS
#MACHINE-LEARNING #DATA-LINEAGE

Dataiku, tutti gli strumenti per impostare e mantenere ogni fase del processo.

#1 Cleaning dei dati

Si tratta della fase in cui si selezionano delle sorgenti e si impostano flussi di trasformazione dei dati che comprendono una serie di operazioni di cleaning (ad esempio reduction, sampling, gestione degli outliers e dei missing values) applicabili attraverso step nativi built-in preimpostati oppure step più generali di scripting in cui è possibile inserire codice personalizzato.

#2 Creazione modelli di Machine Learning

Possibilità di creare modelli di Machine Learning attraverso procedure guidate step-by-step che accompagnano lo sviluppatore nella definizione e studio del modello e nella sua applicazione ai dati. Questi processi built-in nativi si basano su librerie di Machine Learning di ultima generazione (Scikit-Learn, MLlib, XGboost …) oltre a funzionalità di scripting per inserire direttamente codice hand-made nei linguaggi (es. Python).

#3 Visualizzazione

Dataiku DSS offre una vasta gamma di tipologie di grafici e mappe nativi ed integrati, oltre ad una serie di plugin istallabili per venire incontro alle diverse esigenze grafiche di visualizzazione dei dati e dei risultati delle analisi di mining. All’interno delle dashboard è possibile inserire sia grafici esplorativi sui dati, sia i risultati dell’applicazione dei modelli di ML per fornire all’utente finale un’esperienza a 360 gradi.

#4 Deploy in produzione

Dataiku permette, attraverso pochi click, di migrare i progetti dall’ambiente di sviluppo a quello di produzione: l’attività di deploy è semplificata dal fatto che all’interno di ogni progetto in sviluppo è possibile creare dei bundle contenenti la versione attuale del progetto esportabili dall’ambiente di sviluppo e direttamente importabili nell’ambiente di produzione.

#5 Monitoraggio e manutenzione

Dataiku prevede una sezione in cui è possibile monitorare l’esecuzione dei diversi processi: è possibile accedere alla cronologia delle interrogazioni e dell’applicazione dei modelli di ML in ogni momento per verificarne la correttezza e l’adeguatezza delle performance, sia riguardo esecuzioni manuali, sia esecuzioni periodiche schedulate.

Dataiku, Piattaforma Collaborativa

Dataiku può essere utilizzato in modo collaborativo da tutte le figure professionali che si occupano di dati in tutti i settori dell’azienda perché permette di condividere contenuti e monitorare quotidianamente i dati e le metriche più adatte per rispondere alle esigenze aziendali più diverse, ad esempio fraud detection, churn analysis, ottimizzazione della supply chain, manutenzione predittiva e molto altro.

La piattaforma Dataiku DSS è pensata infatti per team composti da figure professionali diverse, come data scientists, analysts, data e IT engineers e anche business users: le caratteristiche di Dataiku lo rendono uno strumento adatto a rispondere alle esigenze di tutti in modo veloce, efficiente ed utile.

BUSINESS ANALYST. Utilizza un’interfaccia grafica semplice ed intuitiva che permette di accedere e lavorare in modo semplice, veloce ed efficiente sui dati. Permette di sperimentare  nuove features avanzate  in ambiente sandbox pur non avendo particolari skills tecnici.

DATA & IT ENGINEER. Monitorare tutte le attività della piattaforma, sia quelle automatizzate, sia le azioni degli utenti: controllo accessi, automazione del deployment dei modelli, gestione modifiche e  rollback. I concetti di consistenza, disponibilità, sicurezza e scalabilità diventano fattori positivi e non colli di bottiglia.

DATA SCIENTIST. Il data scientist può creare e monitorare l’intero processo di analisi, con strumenti nativi, con plugin esterni installabili e con ambiente di scripting in cui  utilizzare linguaggi di mining (es. R e Python). La modularità della piattaforma permette l’impostazione di automazioni riducendo le ridondanze di codice, ottimizzando il tempo di sviluppo permettendo così di focalizzarsi sulla creazione dei modelli descrittivi e predittivi.

ANALYTICS LEADER. Anche utenti non tecnici possono diventare rapidamente operativi nell’interazione con i dati aziendali e i flussi dei processi. Grazie alle dashboard personalizzabili, è possibile comunicare facilmente informazioni agli stakeholders di riferimento (es. clienti, fornitori, …).

CLIENTI ATTIVI +

UTENTI ATTIVI +

Vantaggi nell’uso di Dataiku

Incremento delle entrate

Il marketing è uno dei casi d’applicazione più esemplificativo per il machine learning e uno di quelli con il più grande potenziale per rapido ritorno sull’investimento. Sono possibili analisi come la previsione degli abbandoni (churn analysis), marketing attribution, lead scoring più accurato, mix marketing ottimizzato per macchina, offerte e annunci personalizzati, ottimizzazione automatizzata dei prezzi, raccomandazioni sui prodotti più rilevanti, migliore assistenza clienti.

Vantaggio competitivo

Le aziende che vogliono essere all’avanguardia nell’innovazione e trasformare il loro approccio al mercato seguendo nuove strategie data driven, dovranno rivolgersi ad analisi di machine learning perché questo è il modo più utile e rapido per consentire l’iterazione con l’ambiente in tempo reale.

Diminuzione dei costi

Le operazioni quotidiane di manutenzione e controllo sono, all’interno di ogni azienda, il contesto migliore per sfruttare il machine learning per trovare nuove opportunità. Parliamo di operazioni come la manutenzione predittiva, l’ottimizzazione della supply chain ed in generale l’applicazione di modelli descrittivi o predittivi di controllo nel breve e lungo termine. L’introduzione in azienda di questo tipo di modelli alleggerisce il lavoro dello staff dandogli la possibilità di dedicare più tempo ed energie ad attività creative, coinvolgenti e potenzialmente più redditizie.

Siete pronti per la Data Science Collaborativa?

MASSA

VIA MASSA AVENZA N. 38

0585 842210

ROMA

VIA ERCOLANO SALVI N. 12

06 94804839

MILANO

LARGO RICHINI N. 6

02 58215555