Nell’ultima versione di Dataiku, release 9, sono molte le novità. Quello che si nota in generale è che Dataiku si sta concentrando sugli aspetti caratterizzanti della piattaforma stessa, a dimostrazione di quello che davvero è il suo cuore analitico: gli aspetti più tecnici ed algoritmici del processo di Data Science.

Le energie per questa nuova release si concentrano infatti sul processo di trasformazione del dato in generale andando a far crescere il già ampio insieme di funzionalità code-less fornite agli sviluppatori.

Questa la pagina tecnica di changelog della release 9 della quale proponiamo un abstract riassuntivo di alcune nuove features:

  • 📌 sono stati aggiunti una serie di controlli e warning per gli sviluppatori: l’idea alla base è quella di supportarli nella creazione dei dataset e dei modelli oltre quelli che sono i vincoli sintattici e tecnici in generale;
  • 📌 strumenti di diagnostica per individuare le criticità dei modelli e migliorare le performance degli algoritmi: anche in questo caso Dataiku si spinge oltre gli stretti vincoli formali per guidare gli utilizzatori verso un uso migliore (più adatto) degli algoritmi e relative impostazioni;
  • 📌 estensioni “fuzzy” delle funzionalità di preparazione dei dati: spesso capita che anche operazioni semplici sui dati siano frenate dal loro scarso livello di pulizia, perché è difficile riuscire nelle fasi di cleaning a coprire tutte le casistiche reali. Le estensioni fuzzy aiutano in questo senso perché permettono di unire set di dati “quasi uguali”
  • 📌 è migliorata la gestione di utenti e gruppi, ad esempio adesso è possibile concedere i permessi di accesso ai progetti anche a singoli utenti, invece che a gruppi interi;
  • 📌 il processo di deploy dei progetti e relative API è stato migliorato creando un ambiente unificato per avere una visione centralizzata degli asset e delle pipeline
  • 📌 è aumentato il supporto verso linguaggi e tecnologie terze, ad esempio Dataiku da ora supporta Spark3 e Python3.7.

Rispetto a quest’ultimo aspetto assistiamo ad una svolta importante non solo dal punto di vista strettamente tecnico, ma anche rispetto alle collaborazioni con altri tool, leader per funzionalità affini: l’affiancamento tra Dataiku, leader in materia di Data Science, e Tableau, leader nel settore della Data Visualization.

La creazione di un plugin per collegare in modo diretto questi due ambienti dimostra lo spirito di collaborazione tra realtà consolidate nei rispettivi settori per creare una soluzione molto potente sfruttando i punti di forza dei singoli tools per offrire ai propri utilizzatori un servizio a 360gradi.

Dataiku e Tableau condividono una visione del futuro in cui le persone nelle aziende possano condividere gli insights in modo semplice e veloce. Da un lato Dataiku fornisce l’accesso ai dati e le tecniche di preparazione, trasformazione ed analisi dei dati stessi per lo sviluppo di progetti di Machine Learning, dall’altro Tableau contribuisce grazie alla sua capacità di mostrare dati e insights in tempi rapidissimi. Insieme, Dataiku e Tableau coprono l’intero ciclo di vita del dato, la trasformazione dalla sua forma grezza fino all’estrazione degli insights, per condividere con il business la conoscenza estratta dai dati e la loro storia.” Cit.

Approfondimenti da BNext:

Denodo e la data virtualization a supporto di Machine Learning e Data Science

Il Machine Learning e la Data science sono strettamente legate alla data virtualization. denodo è il tool ideale individuato da BNova

Temporary Management: la nuova frontiera per il cambiamento

Il temporary management è utile nelle fasi di cambiamento aziendale quando serve supporto oltre alle competenze presenti ad organico

Tableau: quanto è importante la Data Visualization?

Quando si parla di “scienza” si tende a non associare gli aspetti creativi, ma senza una buona rappresentazione sono “solo numeri” comprensibili solo da chi li ha prodotti

Niky Analytics, analisi avanzate dei dati per il Retail Marketing

Gli analytics nel retail: Niky Analytics per migliorare l’esperienza del cliente, aumentare le vendite e ottimizzare le operations

BNova e la nuova collaborazione con un partner strategico CDi Manager

CDi Manager, specializzata nel Temporary Management e consulenza strategica, aiuta le aziende a incrementare competitività ed efficienza della propria organizzazione grazie a forme flessibili di ingaggio

Logistica 4.0: il futuro

Quando si parla di Logistica 4.0 si fa riferimento alle tecnologie digitali per stoccaggio e trasporto delle merci, e oggi questa è un esigenza per le aziende, che vengono aiutate da Iot e Big Data. Questa nuova forma di Logistica porta con sè nuove competenze, nuovi...

Predictive Analytics nel Retail marketing, i casi d’uso

Retail marketing, i casi d’uso delle predictive analytics. Alcuni esempi applicativi delle analisi predittive nell’ambito del Retail marketing

Vertica apre le porte alla Data Science

La Data Science, in termini di supporto decisionale alle aziende, ha un potenziale enorme, ma è una materia molto ampia e di carattere sperimentale: non necessariamente l’algoritmo migliore per un settore si rivela buono anche in realtà aziendali diverse. Ogni tecnica...

Retail Analytics, la Data Science applicata al settore del commercio

Cosa sono i Retail Analytics, a cosa servono e per chi sono utili. Scopri come sfruttare al meglio la Retail Data Analysis

Keplero: l’integrazione nell’Industria 4.0

Integrazione nell'Industria 4.0 : i processi produttivi sono in una fase di trasformazione in ottica smart. Ciò che permette questo passaggio è la tecnologia. Oltre all'Industrial IoT entra in gioco anche un approccio rivolto all'integrazione orizzontale e verticale....