VerticaPy è una libreria Python che espone funzionalità scikit-like per la conduzione di progetti di Data Science all’interno del tuo database Vertica.

VerticaPy sfrutta la velocità e le capacità integrate di analisi e apprendimento automatico di Vertica. Supporta l’intero ciclo di vita di un progetto di Data Science utilizzando un meccanismo di “pipeline” per sequenziare le operazioni di trasformazione dei dati (chiamato Virtual Dataframe) e offre diverse opzioni per il rendering grafico.

Grazie alle funzionalità di Machine Learning, data preparation e data exploration, VerticaPy consente di manipolare e analizzare i dati sfruttando al contempo la forza di Vertica, il più potente dwh di analisi sul mercato. VerticaPy porta la logica ai dati: tutto accade nel tuo database.

I vantaggi

 

Le features

VerticaPy è la miscela perfetta tra la scalabilità di Vertica e la flessibilità di Python, offrendo un set unico e indispensabile di strumenti di data science.

Esplora i tuoi dati

Prepara i tuoi dati

Prepara i tuoi dati con le avanzate Features Engineering che sfruttano funzioni di Advanced Analytical e Moving Windows.

Crea i tuoi modelli

Crea un modello grazie al ML Vertica altamente scalabile. Crea e valuta facilmente modelli che ottimizzano l’efficienza e le prestazioni utilizzando molti degli algoritmi ML scalabili nel database.

Tutto ciò avviene là dove dovrebbe essere: nel tuo database. Aggregando i tuoi dati con Vertica puoi costruire, analizzare e modellare tutto quello che vuoi senza modificare i tuoi dati.

 

Le novità di VerticaPy v.04

Ecco alcune utili nuove funzionalità in VerticaPy v.04:

  • ✔️ Calcolo del peso dell’evidenza (WOE) e del valore dell’informazione (IV): comprendi l’influenza dei tuoi predittori sul tuo obiettivo
  • ✔️ Supporto per SHAP Explainers: comprendi cosa influenza il tuo modello Vertica
  • ✔️ Più conversione del modello Vertica: converti il ​​tuo modello Vertica in un modello sklearn
  • ✔️ GeoPandas: disegna bellissime mappe Metodi “magici”: utilizza ancora più funzioni simili a Pandas per filtrare dati e funzioni di elaborazione Molto di più: https://www.vertica.com/python/documentation_last/whats-new-0.4.php

 

 

Articolo originale dal blog Vertica:

? New VerticaPy Features Added

 

Altra documentazione:

? VerticaPy

 

Approfondimenti da BNext:

Data Governance: cosa può fare per aiutare il business

La Data Governance è di supporto per aumentare efficacia ed efficienza dei processi, aiuta a gestire la sicurezza, la privacy, ad ottimizzare le risorse e a garantire agli utenti trasparenza ed affidabilità

Dataiku e Data Exploration: chi è il miglior detective della serie “Scooby-doo”?

Dataiku e la data exploration, il primo passo per impostare i progetti nel modo più adatto è esplorare i dati e imparare a conoscerli.

Keplero: il ruolo dei Big Data per ottimizzare i processi aziendali

Generare Big Data non si traduce automaticamente in un vantaggio, è necessario raccoglierli e gestirli in modo adeguato per sfruttarli al meglio e diventare una Data Driven Enterprise in grado di sfruttare il proprio patrimonio informativo attraverso un sistema in cui le decisioni sono guidate dai dati e dagli analytics

denodo: tutto su cloud, con il supporto della Data Virtualization

Il cloud risolve problemi di gestione costi e risorse, ma aggiunge complessità infrastrutturale: è questo che più frena le aziende nella trasformazione digitale. Denodo è la soluzione di Data Virtualization scelta da BNova

Keplero: approccio data driven, Big Data & IoT

La maggior parte dei Big Data sono prodotti da oggetti connessi. Metterli in correlazione con i dati provenienti dagli altri sistemi permette di fare analisi sempre più accurate e approfondite e approcciare strategie data oriented

Tableau e l’AI a supporto degli utenti per la data visualization: Ask Data

Spesso che gli utenti non trovano risposte perché non sanno come porre le proprie domande di business. Usare il linguaggio naturale può aiutare in questo: Tableau Ask Data

Dataiku viene lanciato in AWS Marketplace

Tutti i clienti AWS potranno accedere a Dataiku e sfruttare la potenza dell’AI: infatti Dataiku adesso è disponibile sul marketplace AWS.

Vertica Eon Accelerator: il percorso più rapido per analisi unificate su cloud

Vertica si affaccia al mondo SaaS e al cloud con Vertica Eon Accelerator, il percorso più rapido per analisi unificate su cloud

Keplero: magazzini più efficienti con il picking automatizzato

Quando si parla di logistica non si può non fare riferimento al “magazzino” che si è evoluto con nuove tecnologie (IoT, RFID, dispositivi mobili) che ne hanno modificato e semplificato la gestione: tutto parte dal picking…

Keplero: big data e machine learning per la logistica

Oggi le aziende hanno a che fare con due grandi questioni: clienti sempre più esigenti e profitti in calo. La Digital Transformation diviene essenziale, e ML e BigData sono una reale opportunità