VerticaPy è una libreria Python che espone funzionalità scikit-like per la conduzione di progetti di Data Science all’interno del tuo database Vertica.

VerticaPy sfrutta la velocità e le capacità integrate di analisi e apprendimento automatico di Vertica. Supporta l’intero ciclo di vita di un progetto di Data Science utilizzando un meccanismo di “pipeline” per sequenziare le operazioni di trasformazione dei dati (chiamato Virtual Dataframe) e offre diverse opzioni per il rendering grafico.

Grazie alle funzionalità di Machine Learning, data preparation e data exploration, VerticaPy consente di manipolare e analizzare i dati sfruttando al contempo la forza di Vertica, il più potente dwh di analisi sul mercato. VerticaPy porta la logica ai dati: tutto accade nel tuo database.

I vantaggi

 

Le features

VerticaPy è la miscela perfetta tra la scalabilità di Vertica e la flessibilità di Python, offrendo un set unico e indispensabile di strumenti di data science.

Esplora i tuoi dati

Prepara i tuoi dati

Prepara i tuoi dati con le avanzate Features Engineering che sfruttano funzioni di Advanced Analytical e Moving Windows.

Crea i tuoi modelli

Crea un modello grazie al ML Vertica altamente scalabile. Crea e valuta facilmente modelli che ottimizzano l’efficienza e le prestazioni utilizzando molti degli algoritmi ML scalabili nel database.

Tutto ciò avviene là dove dovrebbe essere: nel tuo database. Aggregando i tuoi dati con Vertica puoi costruire, analizzare e modellare tutto quello che vuoi senza modificare i tuoi dati.

 

Le novità di VerticaPy v.04

Ecco alcune utili nuove funzionalità in VerticaPy v.04:

  • ✔️ Calcolo del peso dell’evidenza (WOE) e del valore dell’informazione (IV): comprendi l’influenza dei tuoi predittori sul tuo obiettivo
  • ✔️ Supporto per SHAP Explainers: comprendi cosa influenza il tuo modello Vertica
  • ✔️ Più conversione del modello Vertica: converti il ​​tuo modello Vertica in un modello sklearn
  • ✔️ GeoPandas: disegna bellissime mappe Metodi “magici”: utilizza ancora più funzioni simili a Pandas per filtrare dati e funzioni di elaborazione Molto di più: https://www.vertica.com/python/documentation_last/whats-new-0.4.php

 

 

Articolo originale dal blog Vertica:

? New VerticaPy Features Added

 

Altra documentazione:

? VerticaPy

 

Approfondimenti da BNext:

Temporary management e consulenza tecnologica: la forza della partnership tra BNova e CDiManager

I cambiamenti che il temporary manager porta in azienda devono essere sostenuti dal punto di vista tecnologico:la partnership tra BNova e CDi

Denodo e la data virtualization a supporto di Machine Learning e Data Science

Il Machine Learning e la Data science sono strettamente legate alla data virtualization. denodo è il tool ideale individuato da BNova

Temporary Management: la nuova frontiera per il cambiamento

Il temporary management è utile nelle fasi di cambiamento aziendale quando serve supporto oltre alle competenze presenti ad organico

Tableau: quanto è importante la Data Visualization?

Quando si parla di “scienza” si tende a non associare gli aspetti creativi, ma senza una buona rappresentazione sono “solo numeri” comprensibili solo da chi li ha prodotti

BNova e la nuova collaborazione con un partner strategico CDi Manager

CDi Manager, specializzata nel Temporary Management e consulenza strategica, aiuta le aziende a incrementare competitività ed efficienza della propria organizzazione grazie a forme flessibili di ingaggio

Logistica 4.0: il futuro

Quando si parla di Logistica 4.0 si fa riferimento alle tecnologie digitali per stoccaggio e trasporto delle merci, e oggi questa è un esigenza per le aziende, che vengono aiutate da Iot e Big Data. Questa nuova forma di Logistica porta con sè nuove competenze, nuovi...

Dataiku: le novità della release 9

Dataiku, tante novità. Le energie si concentrano sul processo di trasformazione e analisi del dato e sulla collaborazione con altri tool, come Tableau

Vertica apre le porte alla Data Science

La Data Science, in termini di supporto decisionale alle aziende, ha un potenziale enorme, ma è una materia molto ampia e di carattere sperimentale: non necessariamente l’algoritmo migliore per un settore si rivela buono anche in realtà aziendali diverse. Ogni tecnica...

Keplero: l’integrazione nell’Industria 4.0

Integrazione nell'Industria 4.0 : i processi produttivi sono in una fase di trasformazione in ottica smart. Ciò che permette questo passaggio è la tecnologia. Oltre all'Industrial IoT entra in gioco anche un approccio rivolto all'integrazione orizzontale e verticale....

Data Governance: governare processi e responsabilità sui dati. Un use case in ambito finance.

Secondo Gartner erwin by Quest è la soluzione di Data Governance leader di mercato. Ecco i vantaggi in un use case in ambito finance