Per implementare un sistema efficiente di big data analysis, la potenza del motore di elaborazione e l’efficacia degli algoritmi di calcolo non bastano. Bisogna costruire un framework consolidato e ripetibile per migrare i modelli matematici dal laboratorio all’ambiente di produzione. Quindi occorre trasformare gli insights (le evidenze nascoste risultanti delle analisi) in elementi concretamente fruibili da chiunque in azienda. Proposta da Bnova, Dataiku è la piattaforma di data science collaborativa che copre tutta la filiera dalla creazione di un processo di analisi, passando per la definizione del dataset fino ad arrivare alla creazione della reportistica.

Una piattaforma per tutte le tipologie di utenti

 

La principale caratteristica di Dataiku è la struttura modulare che soddisfa le esigenze di figure professionali differenti grazie a un ampio ventaglio di funzionalità, permettendo la collaborazione sinergica.

I business analysts, senza un background tecnico specifico, possono beneficiare di un’interfaccia grafica intuitiva che permette di visualizzare ed esplorare i dati con semplicità.

I data & IT engineers hanno a disposizione una serie di strumenti per monitorare tutte le attività della piattaforma, dal controllo degli accessi degli utenti al deployment automatizzato dei modelli.

I data scientists si avvantaggiano di un insieme di funzionalità per la creazione dei modelli e il monitoraggio del processo di analisi. Possono disporre di strumenti nativi, plugin esterni e di un ambiente di scripting in cui utilizzare linguaggi di mining come R e Python, e impostare alcuni automatismi (ad esempio per ridurre la ridondanza di codice), che permettono di accelerare i tempi di sviluppo e minimizzare gli errori.

Gli analytics leaders dispongono infine di dashboard personalizzabili che permettono di comunicare facilmente le informazioni agli stackholders (ad esempio, clienti e fornitori).

Gestione end-to-end dei progetti analitici

 

Dataiku racchiude all’interno di un’unica piattaforma tutte le funzionalità indispensabili per attivare e gestire un progetto di data science.

La prima fase del processo analitico riguarda la raccolta e la pulizia dei dati pertinenti. Si determinano le fonti e si stabilisce un framework operativo per la pre-elaborazione delle informazioni. Grazie a una serie di procedure pre-impostate oppure di script personalizzabili, è possibile eseguire una sequenza di operazioni di cleaning, come la campionatura o l’eliminazione delle ridondanze.

Successivamente, Dataiku offre la possibilità di sviluppare modelli di machine learning attraverso procedure guidate passo-a-passo, sfruttando librerie integrate di ultima generazione come Scikit-Learn, MLlib e XGboost. I data scientists avranno comunque la possibilità di inserire manualmente nuovo codice nei linguaggi di programmazione più comunemente utilizzati nelle applicazioni di machine learning, come Python.

Dataiku è facilmente utilizzabile anche dagli utenti con meno competenze tecniche, offrendo una serie di strumenti facili e intuitivi di data visualization, con la possibilità di aggiungere ulteriori funzionalità attraverso plugin esterni. Le dashboard offrono una vista a 360 gradi per l’esplorazione dei dati e degli insights analitici mediante un’estesa varietà di mappe e grafici.

All’interno di Dataiku, il deployment dei modelli, ovvero la migrazione dal laboratorio di sviluppo all’ambiente di produzione, viene accelerato grazie alla possibilità di creare bundle del progetto attuale che può essere esportato e mandato live in pochi clic.

Infine la piattaforma proposta da Bnova aggiunge ulteriori elementi di controllo e governance sull’intero processo analitico. Grazie al modulo dedicato, è possibile monitorare le operazioni eseguite, risalendo ad esempio alla cronologia degli accessi e delle interrogazioni oppure verificando la correttezza e le performance dei modelli in azione.

Insomma, grazie alla ricca serie di funzionalità, Dataiku permette di eliminare la complessità di esecuzione dei processi analitici, offrendo una soluzione modulare e onnicomprensiva per la gestione end-to-end, dalla preparazione dei dataset alla visualizzazione degli insights tramite dashboard e report personalizzabili.

New call-to-action

Approfondimenti da BNext:

Dataiku: cosa c’è da sapere sulla nuova release

Le novità più importanti della release 11.0 e 11.1.0 spiegate dal nostro data scientist Emiliano Fuccio

Data Science Lifecycle, le 6 (+1) fasi del processo

La Data Science è un campo di studi interdisciplinare il cui obiettivo finale è estrarre informazione e conoscenza utili da dati strutturati o non strutturati. Non esiste un framework unico e universalmente condivido per definire i processi di Data Science, tuttavia, dal punto di vista tecnico lo standard KDD è quello a cui ci si ispira maggiormente, perché indica l’intero processo di ricerca di nuova conoscenza dai dati.

A cosa serve la Data Science?

L’analisi dei dati è in generale una materia molto ampia e con una storia che rimanda indietro di diversi anni da oggi. Si inizia a parlare di analisi dati già alla fine del 1700 con le prime visualizzazioni grafiche e l’evoluzione di questa materia non solo negli...

Churn Strategy: gli step per impostarla al meglio minimizzando il Churn Rate

Churn analysis e churn rate sono due concetti strettamente connessi: l’analisi degli abbandoni (churn analysis) è quella branca della Data Science attraverso cui si cerca di prevedere quali clienti hanno maggiori probabilità di abbandonare l’azienda, cosa che si...

I 6 comandamenti per un Data Storytelling di successo 

Letteralmente il Data Storytelling è l’arte del raccontare una storia attraverso i dati. Si tratta dell’evoluzione della Data Visualization, l’ultimo step di quel lungo processo analitico che ha lo scopo di trasformare i dati provenienti dalle diverse origini di...

Cosa sono i Big Data e come vengono utilizzati?

I Big Data sono ormai entrati a far parte del mercato tecnologico globale, ma spesso questa definizione viene utilizzata senza aver chiaro di cosa si tratta o di quali sono le accortezze e le tecnologie necessarie per poterli sfruttare al meglio nel loro valore...

Chi è e quanto guadagna un Data Engineer?

Fino a qualche tempo fa occuparsi dell’analisi dati in azienda voleva dire fare BI, e non era difficile trovare figure che si occupassero di questo. Nell’ultimo decennio, invece, l’analisi dati si è evoluta in modo esponenziale, si inizia a parlare di Data Science,...

Eyes4Innovation, la rete che ti semplifica la vita

La rete ti semplifica la vita. Ecco la massima sintesi del motivo per cui è nata Eyes4Innovation, ed anche lo scopo ultimo perseguito dalle aziende fondatrici. Scopri com’è andato l’evento di presentazione.

Dataiku e Data Exploration: chi è il miglior detective della serie “Scooby-doo”?

Dataiku e la data exploration, il primo passo per impostare i progetti nel modo più adatto è esplorare i dati e imparare a conoscerli.

Dataiku viene lanciato in AWS Marketplace

Tutti i clienti AWS potranno accedere a Dataiku e sfruttare la potenza dell’AI: infatti Dataiku adesso è disponibile sul marketplace AWS.