VerticaPy è una libreria Python che espone funzionalità scikit-like per la conduzione di progetti di Data Science all’interno del tuo database Vertica.

VerticaPy sfrutta la velocità e le capacità integrate di analisi e apprendimento automatico di Vertica. Supporta l’intero ciclo di vita di un progetto di Data Science utilizzando un meccanismo di “pipeline” per sequenziare le operazioni di trasformazione dei dati (chiamato Virtual Dataframe) e offre diverse opzioni per il rendering grafico.

Grazie alle funzionalità di Machine Learning, data preparation e data exploration, VerticaPy consente di manipolare e analizzare i dati sfruttando al contempo la forza di Vertica, il più potente dwh di analisi sul mercato. VerticaPy porta la logica ai dati: tutto accade nel tuo database.

I vantaggi

> La scalabilità di Vertica: tutte le operazioni pesanti dal punto di vista computazionale sono eseguite da Vertica. Ottieni i vantaggi di una infrastruttura MMpcolonnare costruita su misura per le analytics.

> La flessibilità di Python: Le API sono codificate interamente in Python e generano codice SQL on-the-fly per interagire con il database.

> Funzionalità Pandas like: L’oggetto vDataFrame offre funzionalità dimili al DataFrame in pandas, ma demanda le computazioni più pesanti a Vertica, consentendo una transizione senza interruzioni da small data a big data.

> In-database Data Science: VerticaPy sfrutta le funzionalità di Vertica di Machine Learning in-database e advanced-sql fornendo unìampia scelta di astrazioni per semplificare il processo di Data Science.

Le features

VerticaPy è la miscela perfetta tra la scalabilità di Vertica e la flessibilità di Python, offrendo un set unico e indispensabile di strumenti di data science.

Esplora i tuoi dati

Prepara i tuoi dati

Prepara i tuoi dati con le avanzate Features Engineering che sfruttano funzioni di Advanced Analytical e Moving Windows.

Crea i tuoi modelli

Crea un modello grazie al ML Vertica altamente scalabile. Crea e valuta facilmente modelli che ottimizzano l’efficienza e le prestazioni utilizzando molti degli algoritmi ML scalabili nel database.

Tutto ciò avviene là dove dovrebbe essere: nel tuo database. Aggregando i tuoi dati con Vertica puoi costruire, analizzare e modellare tutto quello che vuoi senza modificare i tuoi dati.

Le novità di VerticaPy v.04

Ecco alcune utili nuove funzionalità in VerticaPy v.04:

  • – Calcolo del peso dell’evidenza (WOE) e del valore dell’informazione (IV): comprendi l’influenza dei tuoi predittori sul tuo obiettivo
  • – Supporto per SHAP Explainers: comprendi cosa influenza il tuo modello Vertica
  • – Più conversione del modello Vertica: converti il ​​tuo modello Vertica in un modello sklearn
  • – GeoPandas: disegna bellissime mappe Metodi “magici”: utilizza ancora più funzioni simili a Pandas per filtrare dati e funzioni di elaborazione Molto di più: https://www.vertica.com/python/documentation_last/whats-new-0.4.php

Articolo originale dal blog Vertica: New VerticaPy Features Added

Documentazione su VerticaPy: VerticaPy

ARGOMENTI CORRELATI
Categoria: DATA SCIENCE
Le fasi del processo analitico di Data Science. Immagine che raffigura persone di fronte ad una lavagna bianca su cui sono rappresentate le 6 fasi della Data Science.

Data Science Lifecycle, le 6 (+1) fasi del processo

La Data Science è un campo di studi interdisciplinare il cui obiettivo finale è estrarre informazione e conoscenza utili da… Leggi tutto

Concept grafico che richiama i vantaggi ottenibili con la Data Science. Immagine che raffigura una donna che sorride davanti al computer.

A cosa serve la Data Science?

L’analisi dei dati è in generale una materia molto ampia e con una storia che rimanda indietro di diversi anni… Leggi tutto

Concept grafico che richiama la Churn Strategy e come impostarla al meglio minimizza il churn rate. Immagine che raffigura un uomo e una donna seduti alla scrivenia di fronte al pc che battono il pugno soddisfatti

Churn Strategy: gli step per impostarla al meglio minimizzando il Churn Rate

Churn analysis e churn rate sono due concetti strettamente connessi: l’analisi degli abbandoni (churn analysis) è quella branca della Data… Leggi tutto