Nell’ultima versione di Dataiku, release 9, sono molte le novità. Quello che si nota in generale è che Dataiku si sta concentrando sugli aspetti caratterizzanti della piattaforma stessa, a dimostrazione di quello che davvero è il suo cuore analitico: gli aspetti più tecnici ed algoritmici del processo di Data Science.
Le energie per questa nuova release si concentrano infatti sul processo di trasformazione del dato in generale andando a far crescere il già ampio insieme di funzionalità code-less fornite agli sviluppatori.
Questa la pagina tecnica di changelog della release 9 della quale proponiamo un abstract riassuntivo di alcune nuove features:
- – sono stati aggiunti una serie di controlli e warning per gli sviluppatori: l’idea alla base è quella di supportarli nella creazione dei dataset e dei modelli oltre quelli che sono i vincoli sintattici e tecnici in generale;
- – strumenti di diagnostica per individuare le criticità dei modelli e migliorare le performance degli algoritmi: anche in questo caso Dataiku si spinge oltre gli stretti vincoli formali per guidare gli utilizzatori verso un uso migliore (più adatto) degli algoritmi e relative impostazioni;
- – estensioni “fuzzy” delle funzionalità di preparazione dei dati: spesso capita che anche operazioni semplici sui dati siano frenate dal loro scarso livello di pulizia, perché è difficile riuscire nelle fasi di cleaning a coprire tutte le casistiche reali. Le estensioni fuzzy aiutano in questo senso perché permettono di unire set di dati “quasi uguali”
- – è migliorata la gestione di utenti e gruppi, ad esempio adesso è possibile concedere i permessi di accesso ai progetti anche a singoli utenti, invece che a gruppi interi;
- – il processo di deploy dei progetti e relative API è stato migliorato creando un ambiente unificato per avere una visione centralizzata degli asset e delle pipeline
- – è aumentato il supporto verso linguaggi e tecnologie terze, ad esempio Dataiku da ora supporta Spark3 e Python3.7.
Rispetto a quest’ultimo aspetto assistiamo ad una svolta importante non solo dal punto di vista strettamente tecnico, ma anche rispetto alle collaborazioni con altri tool, leader per funzionalità affini: l’affiancamento tra Dataiku, leader in materia di Data Science, e Tableau, leader nel settore della Data Visualization.
La creazione di un plugin per collegare in modo diretto questi due ambienti dimostra lo spirito di collaborazione tra realtà consolidate nei rispettivi settori per creare una soluzione molto potente sfruttando i punti di forza dei singoli tools per offrire ai propri utilizzatori un servizio a 360gradi.
“Dataiku e Tableau condividono una visione del futuro in cui le persone nelle aziende possano condividere gli insights in modo semplice e veloce. Da un lato Dataiku fornisce l’accesso ai dati e le tecniche di preparazione, trasformazione ed analisi dei dati stessi per lo sviluppo di progetti di Machine Learning, dall’altro Tableau contribuisce grazie alla sua capacità di mostrare dati e insights in tempi rapidissimi. Insieme, Dataiku e Tableau coprono l’intero ciclo di vita del dato, la trasformazione dalla sua forma grezza fino all’estrazione degli insights, per condividere con il business la conoscenza estratta dai dati e la loro storia.” Cit.