Data Visualization e Data Science in un'unica soluzione

Mai come in questo momento la Data Visualization e la Data Science si trovano ad essere così vicine grazie all’integrazione di Tableau con R.

Tableau di default offre diverse funzionalità di Advanced Analytics che includono il forecasting, il clustering e la regressione lineare;

“ma se volessimo aver accesso all’intero panorama di librerie statistiche
per poter rendere ancora più efficiente la nostra visualizzazione?”

La risposta alla domanda è semplice e Tableau risolve questo quesito attraverso l’integrazione diretta con il software di analisi statistica R, sfruttando le ampie potenzialità di quest’ultimo e rendendole dinamiche e chiare con le tecniche di visualizzazione in Tableau. Per consentire l’integrazione di Tableau Desktop e Tableau Server con software analitici esterni, in questo caso R, Tableau invia script e dati a tali estensioni, dove vengono elaborati i risultati e restituiti a Tableau pronti per essere applicati nelle visualizzazioni (per la procedura operativa di connessione Clicca qui).

Tableau & R

Cosa è R?

R è un linguaggio di programmazione e un ambiente di sviluppo specifico per l’analisi statistica e l’implementazione di algoritmi machine learning.

È un open source gratuito, utilizzato da una comunità di milioni di utenti, che include migliaia di collaboratori provenienti da settori diversi, che espandono le capacità di programmazione attraverso la creazione di nuove librerie statistiche. Il linguaggio R è un attore chiave nelle attività aziendali di analisi dei Big Data, ma richiede specialisti con una preparazione elevata per poter essere elaborato, in quanto la curva di apprendimento è ripida se non si è un programmatore esperto.

Con l’integrazione di R in Tableau diventa tutto più semplice!

Grazie alla dinamicità di Tableau chiunque può accedere ai dati analizzati in R attraverso la creazione e la condivisione di Dashboard interattive su Tableau Server, cosicché anche gli spettatori che non hanno mai sentito parlare di R potranno trarne vantaggio semplicemente interagendo con la visualizzazione.

Il beneficio che deriva dall’unione di Tableau e R è reciproco:

  • Dinamicità e interattività per gli utenti esperti nel linguaggio R, attraverso l’esplorazione dei dati in Tableau;
  • Analisi statistiche dettagliate per gli specialisti di Dashboard in Tableau grazie alla disponibilità delle librerie statistiche di R.

Sfida vinta con successo da Tableau

La sfida vinta con successo da Tableau è stata riuscire a rendere accessibile a tutti le potenzialità dei dati analizzati in R, senza che l’utente debba conoscere alcun linguaggio di programmazione. Inoltre è stato ridotto ampiamente il gap tra Data Science e Business Intelligence rendendo le analisi più efficienti e dinamiche, attraverso l’ideazione, la pianificazione e la progettazione di modelli in grado di comprendere, scoprire e prevedere informazioni rilevanti alla base dei dati su cui elaborare strategie per poter accrescere il vantaggio competitivo in qualsiasi ambito di applicazione.

Un esempio pratico: Forecasting con Tableau & R

Tableau Dashboard

Come risultato dell’integrazione di Tableau con R si riporta l’applicazione di una metodologia di forecasting con i modelli Arima (Autoregressive Integrated Moving Average).

In Tableau l’unico modo per poter implementare i suddetti modelli ai dati analizzati è attraverso l’integrazione con il software R. Si analizza la seguente applicazione:

  • Dataset: “Superstore”;
  • Orizzonte Temporale: osservazioni settimanali da gen-2016 a dic-2019;
  • Obiettivo Analisi: previsione dei futuri Profitti/Vendite/Quantità vendute in America.

La tecnica di analisi utilizzata per valutare se un modello Arima è migliore di un altro è quella del backtesting in modalità “rolling window”. Di seguito si riporta il procedimento seguito:

  1. Si individua una finestra all’interno della serie storica analizzata, che rappresenta il periodo “in sample” da gen-2016 a dic-2018, dove sono applicati i modelli per la determinazione dei loro parametri;
  2. Attraverso il criterio di valutazione Akaike (AIC) si seleziona il modello con i parametri più significativi;
  3. Una volta selezionato e validato il modello, si applica la metodologia di forecasting nel periodo “out of sample” di 1 settimana.

Dopo ogni forecast, sono ripetuti i primi 3 step per l’intero arco temporale “out of sample”, spostando la finestra “in sample” di un istante temporale.

tableau Backtesting

Attraverso l’integrazione di R è stato implementato in Tableau l’algoritmo che segue tutti gli step del procedimento descritto. Questo ha permesso di calcolare le osservazioni previsionali per l’intero periodo “out of sample” da gen-2019 a dic-2019. Di seguito si riporta il risultato della metodologia elaborata.

tableau Arima Model

  • In verde è evidenziata la serie storica delle osservazioni “in sample” del campione preso in considerazione (Hystorical Analysis). I valori sono denominati “Actual” perché già realizzati;
  • In blu sono rappresentati i valori previsionali del modello selezionato (Predictive Analysis) che sono definiti Forecast perché rappresentano delle previsioni: al tempo t si predice un valore con un orizzonte temporale t+1  non ancora realizzato.

Per esaminare più nel particolare la Predictive Analysis è opportuno confrontare il trend delle osservazioni previsionali (Forecast) elaborate dal modello e quelle effettivamente realizzate a consuntivo (Actual). Di seguito si riporta il grafico appena descritto.

tableau Forecast vs Actual-min

Dalla visualizzazione, si rileva che il modello Arima selezionato per il forecasting evidenzia un’elevata accuratezza previsionale. Infatti i due trend analizzati hanno lo stesso andamento, ciò significa che i parametri del modello Arima sono significativi e l’analisi è consistente.

I vantaggi che se ne traggono dal Forecasting con Tableau & R sono molteplici:

  1. Offrire visibilità sulle performance dell’impresa;
  2. Accelerare la disponibilità di informazioni per pianificare strategie future, grazie a scenari di analisi sempre più dettagliati;
  3. Monitoraggio degli indicatori analizzati.

Questo esempio ha mostrato come l’integrazione di Tableau con R ha permesso di sviluppare un’analisi personalizzata, interattiva e dinamica, direttamente applicata ai dati analizzati in Tableau e pronta ad essere visualizzata nella Dashboard.