VerticaPy è una libreria Python che espone funzionalità scikit-like per la conduzione di progetti di Data Science all’interno del tuo database Vertica.

VerticaPy sfrutta la velocità e le capacità integrate di analisi e apprendimento automatico di Vertica. Supporta l’intero ciclo di vita di un progetto di Data Science utilizzando un meccanismo di “pipeline” per sequenziare le operazioni di trasformazione dei dati (chiamato Virtual Dataframe) e offre diverse opzioni per il rendering grafico.

Grazie alle funzionalità di Machine Learning, data preparation e data exploration, VerticaPy consente di manipolare e analizzare i dati sfruttando al contempo la forza di Vertica, il più potente dwh di analisi sul mercato. VerticaPy porta la logica ai dati: tutto accade nel tuo database.

I vantaggi

> La scalabilità di Vertica: tutte le operazioni pesanti dal punto di vista computazionale sono eseguite da Vertica. Ottieni i vantaggi di una infrastruttura MMpcolonnare costruita su misura per le analytics.

> La flessibilità di Python: Le API sono codificate interamente in Python e generano codice SQL on-the-fly per interagire con il database.

> Funzionalità Pandas like: L’oggetto vDataFrame offre funzionalità dimili al DataFrame in pandas, ma demanda le computazioni più pesanti a Vertica, consentendo una transizione senza interruzioni da small data a big data.

> In-database Data Science: VerticaPy sfrutta le funzionalità di Vertica di Machine Learning in-database e advanced-sql fornendo unìampia scelta di astrazioni per semplificare il processo di Data Science.

Le features

VerticaPy è la miscela perfetta tra la scalabilità di Vertica e la flessibilità di Python, offrendo un set unico e indispensabile di strumenti di data science.

Esplora i tuoi dati

Prepara i tuoi dati

Prepara i tuoi dati con le avanzate Features Engineering che sfruttano funzioni di Advanced Analytical e Moving Windows.

Crea i tuoi modelli

Crea un modello grazie al ML Vertica altamente scalabile. Crea e valuta facilmente modelli che ottimizzano l’efficienza e le prestazioni utilizzando molti degli algoritmi ML scalabili nel database.

Tutto ciò avviene là dove dovrebbe essere: nel tuo database. Aggregando i tuoi dati con Vertica puoi costruire, analizzare e modellare tutto quello che vuoi senza modificare i tuoi dati.

Le novità di VerticaPy v.04

Ecco alcune utili nuove funzionalità in VerticaPy v.04:

  • – Calcolo del peso dell’evidenza (WOE) e del valore dell’informazione (IV): comprendi l’influenza dei tuoi predittori sul tuo obiettivo
  • – Supporto per SHAP Explainers: comprendi cosa influenza il tuo modello Vertica
  • – Più conversione del modello Vertica: converti il ​​tuo modello Vertica in un modello sklearn
  • – GeoPandas: disegna bellissime mappe Metodi “magici”: utilizza ancora più funzioni simili a Pandas per filtrare dati e funzioni di elaborazione Molto di più: https://www.vertica.com/python/documentation_last/whats-new-0.4.php

Articolo originale dal blog Vertica: New VerticaPy Features Added

Documentazione su VerticaPy: VerticaPy

ARGOMENTI CORRELATI
Categoria: DATA SCIENCE
Concept grafico che richiama il Data Storytelling

I 6 comandamenti per un Data Storytelling di successo 

Letteralmente il Data Storytelling è l’arte del raccontare una storia attraverso i dati. Si tratta dell’evoluzione della Data Visualization, l’ultimo… Leggi tutto

Concept grafico che richiama le 5V dei Big Data

Cosa sono i Big Data e come vengono utilizzati?

I Big Data sono ormai entrati a far parte del mercato tecnologico globale, ma spesso questa definizione viene utilizzata senza… Leggi tutto

Concept che richiama la figura del Data Engineer

Chi è e quanto guadagna un Data Engineer?

Fino a qualche tempo fa occuparsi dell’analisi dati in azienda voleva dire fare BI, e non era difficile trovare figure… Leggi tutto