La Data Science, in termini di supporto decisionale alle aziende, ha un potenziale enorme, ma è una materia molto ampia e di carattere sperimentale: non necessariamente l’algoritmo migliore per un settore si rivela buono anche in realtà aziendali diverse. Ogni tecnica e algoritmo ha caratteristiche particolari che lo rendono adatto per certi aspetti, ma può rilevarsi poco informativo su altri. Per questo è importante avere un team che ben conosca le diverse caratteristiche delle tecniche analitiche in modo da poter individuare la soluzione migliore al contesto aziendale per evitare di esporsi a spese e rischi inutili ed investire anzi le proprie energie solo sugli aspetti che davvero portano un vantaggio.

D’altro canto la necessità di fare (e di usare) analisi di questo tipo è sempre più diffusa anche da parte di utenti non tecnici, ad esempio in ambito marketing o sales, che non sono tenuti invece a conoscere tecnicamente le diverse sfaccettature. È però importante che, almeno ad alto livello, anche loro abbiano per lo meno la percezione della varietà presente dietro queste analisi e della conseguente ampia scelta di tecniche analitiche e algoritmi.

A dimostrazione di quanto sia importante diffondere questa consapevolezza proponiamo una recente iniziativa di Vertica: un corso di Data Science gratuito, fruibile da tutti direttamente su youtube, e caratterizzato dalla presenza di elementi teorici ai quali vengono man mano associati casi pratici in modo da calare i diversi concetti in un reale contesto applicativo e permettere anche a utenti non tecnici di percepirne le potenzialità.

Vertica, DB analitico leader di mercato, non solo si sta evolvendo per fornire ai propri utilizzatori tecnici funzionalità analitiche sempre più potenti e performanti (“Grafici animati, autoML, analisi geospaziali: le novità di VerticaPy v0.6“), ma sta mostrando di non aver timore di diffondere la cultura del dato e delle analitiche sul dato. Anzi, la volontà è proprio quella di diffondere conoscenza per aumentare la fiducia verso queste tematiche a vantaggio della trasformazione strategica delle aziende in ottica Data Driven.

 

Il corso di Data Science di Vertica

Ogni settimana Vertica pubblica video su diversi concetti di Data Science, preparazione e modellazione dei dati e algoritmi.

Nel primo video si parla di analisi di correlazione. Vengono mostrate alcune delle principali funzioni che possono essere usate per implementare diversi tipi di correlazione: ogni funzione rappresenta un “modello” che si adatta a particolari contesti. È importante sapere che ne esistono di diverso tipo e conoscere le diverse caratteristiche di ognuna per poter identificare quella che meglio descrive il contesto aziendale. Per questo è importante sapere che non esiste una sola forma di correlazione, ma che, a seconda del dominio, della forma dei dati e del risultato che si vuole ottenere, la scelta di una certa funzione può dimostrarsi “migliore” (più adatta) di un’altra.

correlation_functions

Si parla inoltre delle best practises per impostare correttamente un progetto e valutarne la bontà, ed è l’occasione giusta per introdurre nel corso Jupiter, l’ambiente in cui scrivere il proprio codice python sfruttando le funzionalità di VerticaPy.

Il secondo videoHow to develop telco attribution model for marketing compaign” è a tutti gli effetti la presentazione di un case per la creazione di un modello destinato al marketing. Si parte dall’analisi delle azioni dei clienti fino ad arrivare ad impostare una profilazione degli utenti e comprendere le cause delle loro azioni.

Approfondimenti da BNext:

Denodo e la data virtualization a supporto di Machine Learning e Data Science

Il Machine Learning e la Data science sono strettamente legate alla data virtualization. denodo è il tool ideale individuato da BNova

Temporary Management: la nuova frontiera per il cambiamento

Il temporary management è utile nelle fasi di cambiamento aziendale quando serve supporto oltre alle competenze presenti ad organico

Tableau: quanto è importante la Data Visualization?

Quando si parla di “scienza” si tende a non associare gli aspetti creativi, ma senza una buona rappresentazione sono “solo numeri” comprensibili solo da chi li ha prodotti

BNova e la nuova collaborazione con un partner strategico CDi Manager

CDi Manager, specializzata nel Temporary Management e consulenza strategica, aiuta le aziende a incrementare competitività ed efficienza della propria organizzazione grazie a forme flessibili di ingaggio

Logistica 4.0: il futuro

Quando si parla di Logistica 4.0 si fa riferimento alle tecnologie digitali per stoccaggio e trasporto delle merci, e oggi questa è un esigenza per le aziende, che vengono aiutate da Iot e Big Data. Questa nuova forma di Logistica porta con sè nuove competenze, nuovi...

Dataiku: le novità della release 9

Dataiku, tante novità. Le energie si concentrano sul processo di trasformazione e analisi del dato e sulla collaborazione con altri tool, come Tableau

Keplero: l’integrazione nell’Industria 4.0

Integrazione nell'Industria 4.0 : i processi produttivi sono in una fase di trasformazione in ottica smart. Ciò che permette questo passaggio è la tecnologia. Oltre all'Industrial IoT entra in gioco anche un approccio rivolto all'integrazione orizzontale e verticale....

Data Governance: governare processi e responsabilità sui dati. Un use case in ambito finance.

Secondo Gartner erwin by Quest è la soluzione di Data Governance leader di mercato. Ecco i vantaggi in un use case in ambito finance

denodo: Unified Semantic Layer per portare la democrazia e mettere ordine nel caos

Uno strato semantico unico, senza bisogno complessi processi ETL e senza muovere i dati dalla loro origine

Keplero: e-mobility e la rivoluzione green per l’automotive

Far fronte ai cambiamenti climatici è uno dei motivi che spinge le aziende automobilistiche a ridurre le emissioni di CO2. Questo aspetto insieme al crescente prezzo del petrolio sono la spinta verso la ricerca di soluzioni innovative e sostenibili anche nell'ambito...