Nell’ultima versione di Dataiku, release 9, sono molte le novità. Quello che si nota in generale è che Dataiku si sta concentrando sugli aspetti caratterizzanti della piattaforma stessa, a dimostrazione di quello che davvero è il suo cuore analitico: gli aspetti più tecnici ed algoritmici del processo di Data Science.

Le energie per questa nuova release si concentrano infatti sul processo di trasformazione del dato in generale andando a far crescere il già ampio insieme di funzionalità code-less fornite agli sviluppatori.

Questa la pagina tecnica di changelog della release 9 della quale proponiamo un abstract riassuntivo di alcune nuove features:

  • – sono stati aggiunti una serie di controlli e warning per gli sviluppatori: l’idea alla base è quella di supportarli nella creazione dei dataset e dei modelli oltre quelli che sono i vincoli sintattici e tecnici in generale;
  • – strumenti di diagnostica per individuare le criticità dei modelli e migliorare le performance degli algoritmi: anche in questo caso Dataiku si spinge oltre gli stretti vincoli formali per guidare gli utilizzatori verso un uso migliore (più adatto) degli algoritmi e relative impostazioni;
  • – estensioni “fuzzy” delle funzionalità di preparazione dei dati: spesso capita che anche operazioni semplici sui dati siano frenate dal loro scarso livello di pulizia, perché è difficile riuscire nelle fasi di cleaning a coprire tutte le casistiche reali. Le estensioni fuzzy aiutano in questo senso perché permettono di unire set di dati “quasi uguali”
  • – è migliorata la gestione di utenti e gruppi, ad esempio adesso è possibile concedere i permessi di accesso ai progetti anche a singoli utenti, invece che a gruppi interi;
  • – il processo di deploy dei progetti e relative API è stato migliorato creando un ambiente unificato per avere una visione centralizzata degli asset e delle pipeline
  • – è aumentato il supporto verso linguaggi e tecnologie terze, ad esempio Dataiku da ora supporta Spark3 e Python3.7.

Rispetto a quest’ultimo aspetto assistiamo ad una svolta importante non solo dal punto di vista strettamente tecnico, ma anche rispetto alle collaborazioni con altri tool, leader per funzionalità affini: l’affiancamento tra Dataiku, leader in materia di Data Science, e Tableau, leader nel settore della Data Visualization.

La creazione di un plugin per collegare in modo diretto questi due ambienti dimostra lo spirito di collaborazione tra realtà consolidate nei rispettivi settori per creare una soluzione molto potente sfruttando i punti di forza dei singoli tools per offrire ai propri utilizzatori un servizio a 360gradi.

Dataiku e Tableau condividono una visione del futuro in cui le persone nelle aziende possano condividere gli insights in modo semplice e veloce. Da un lato Dataiku fornisce l’accesso ai dati e le tecniche di preparazione, trasformazione ed analisi dei dati stessi per lo sviluppo di progetti di Machine Learning, dall’altro Tableau contribuisce grazie alla sua capacità di mostrare dati e insights in tempi rapidissimi. Insieme, Dataiku e Tableau coprono l’intero ciclo di vita del dato, la trasformazione dalla sua forma grezza fino all’estrazione degli insights, per condividere con il business la conoscenza estratta dai dati e la loro storia.” Cit.

Approfondimenti da BNext:

Data Science Lifecycle, le 6 (+1) fasi del processo

La Data Science è un campo di studi interdisciplinare il cui obiettivo finale è estrarre informazione e conoscenza utili da dati strutturati o non strutturati. Non esiste un framework unico e universalmente condivido per definire i processi di Data Science, tuttavia, dal punto di vista tecnico lo standard KDD è quello a cui ci si ispira maggiormente, perché indica l’intero processo di ricerca di nuova conoscenza dai dati.

A cosa serve la Data Science?

L’analisi dei dati è in generale una materia molto ampia e con una storia che rimanda indietro di diversi anni da oggi. Si inizia a parlare di analisi dati già alla fine del 1700 con le prime visualizzazioni grafiche e l’evoluzione di questa materia non solo negli...

Churn Strategy: gli step per impostarla al meglio minimizzando il Churn Rate

Churn analysis e churn rate sono due concetti strettamente connessi: l’analisi degli abbandoni (churn analysis) è quella branca della Data Science attraverso cui si cerca di prevedere quali clienti hanno maggiori probabilità di abbandonare l’azienda, cosa che si...

I 6 comandamenti per un Data Storytelling di successo 

Letteralmente il Data Storytelling è l’arte del raccontare una storia attraverso i dati. Si tratta dell’evoluzione della Data Visualization, l’ultimo step di quel lungo processo analitico che ha lo scopo di trasformare i dati provenienti dalle diverse origini di...

Cosa sono i Big Data e come vengono utilizzati?

I Big Data sono ormai entrati a far parte del mercato tecnologico globale, ma spesso questa definizione viene utilizzata senza aver chiaro di cosa si tratta o di quali sono le accortezze e le tecnologie necessarie per poterli sfruttare al meglio nel loro valore...

Chi è e quanto guadagna un Data Engineer?

Fino a qualche tempo fa occuparsi dell’analisi dati in azienda voleva dire fare BI, e non era difficile trovare figure che si occupassero di questo. Nell’ultimo decennio, invece, l’analisi dati si è evoluta in modo esponenziale, si inizia a parlare di Data Science,...

Eyes4Innovation, la rete che ti semplifica la vita

La rete ti semplifica la vita. Ecco la massima sintesi del motivo per cui è nata Eyes4Innovation, ed anche lo scopo ultimo perseguito dalle aziende fondatrici. Scopri com’è andato l’evento di presentazione.

Dataiku e Data Exploration: chi è il miglior detective della serie “Scooby-doo”?

Dataiku e la data exploration, il primo passo per impostare i progetti nel modo più adatto è esplorare i dati e imparare a conoscerli.

Dataiku viene lanciato in AWS Marketplace

Tutti i clienti AWS potranno accedere a Dataiku e sfruttare la potenza dell’AI: infatti Dataiku adesso è disponibile sul marketplace AWS.

Denodo e la data virtualization a supporto di Machine Learning e Data Science

Il Machine Learning e la Data science sono strettamente legate alla data virtualization. denodo è il tool ideale individuato da BNova