Le nuove funzionalità di Predictive Analytics in Tableau: Model Quantile e Model Percentile

Con il nuovo aggiornamento di Tableau Desktop 2020.3 sono state implementate due importanti funzioni di Predictive Analytics che ampliano le possibilità di effettuare previsioni interattive, con l’obiettivo di pianificare strategie future grazie a scenari di analisi sempre più dettagliati:

1. MODEL_QUANTILE (quantile, target_expression, predictor_expression(s))

Dato un quantile compreso tra 0 e 1, il Model Quantile assegna un valore obiettivo (target_expression) dipendente da altri predittori che l’utente può includere.

Attraverso il campo predictor_expression(s) l’utente può scegliere discrezionalmente in base all’analisi effettuata di inserire dei regressori o variabili indipendenti (dimensioni o misure) per rendere ancora più puntuale la predizione.

Le principali caratteristiche del modello sono:

  • Effettuare analisi predittive su un indicatore selezionato determinandone il suo probabile valore futuro;
  • Stimare i valori limite che definiscono la variabile target generando un intervallo di confidenza previsionale.

2. MODEL_PERCENTILE (target_expression, predictor_expression(s))

Il Model Percentile restituisce la probabilità compresa tra 0 e 1 che un valore non osservato definito target o variabile dipendente, sia minore o uguale a quello realizzato.

Questo modello si basa sulla funzione di ripartizione o di densità cumulata (per maggiori informazioni Clicca qui).

Le principali caratteristiche del modello sono le seguenti:

  • Fissare per ogni valore dell’indicatore analizzato la probabilità di avere in futuro un valore vicino a quello ottenuto;
  • Evidenziare possibili correlazioni nei dati attraverso l’uso di predittori diversi (dimensioni o misure);
  • Individuare direttamente nella visualizzazione i valori meno probabili definiti outlier

Un’applicazione del Model Quantile

La prima applicazione pratica è volta allo studio del Model Quantile con l’obiettivo di effettuare una previsione su un indicatore. Dato che il fine è riuscire a determinare il valore più vicino a quello effettivamente verificato, il quantile è posto alla mediana (0.5 o 50 esimo percentile) essendo il valore con la più alta probabilità di realizzo.

Il dataset di riferimento utilizzato per l’analisi è il Sample Superstore presente in Tableau.

Come primo step si definisce la funzione Target, individuata dalle vendite, sulla quale si vuole effettuare il Forecasting. La visualizzazione è così strutturata:

  • Grafico a barre: valori delle vendite ottenuti nel arco temporale di analisi
  • Grafico a linea: valori predetti dal Model Quantile

In un primo momento consideriamo il tempo come unico regressore.

Di seguito si riporta il confronto tra l’andamento delle vendite ed il modello di predizione applicato:

confronto tra l’andamento delle vendite ed il modello di predizione applicato

Come si evince dall’analisi, il modello riesce a cogliere solamente l’andamento temporale non adattandosi puntualmente alla serie storica delle vendite.

Il motivo principale è dato dal fatto che l’unica variabile indipendente è il tempo, ma analizzando il contesto e considerando come variabili esplicative anche il profitto, lo sconto e la quantità, poiché direttamente correlate alle vendite, il risultato è il seguente:

Il modello previsionale calcolato si adatta alla serie storica delle vendite con prestazioni vicine ai valori ottenuti

Il modello previsionale calcolato si adatta alla serie storica delle vendite con prestazioni vicine ai valori ottenuti. In questo modo è stata dimostrata l’importanza dei regressori inseriti all’interno del modello, in quanto la correlazione tra essi e la funzione obiettivo è direttamente proporzionale: all’aumentare delle variabili correlate migliorano notevolmente le prestazioni del modello.

Se volessimo valutare l’effettiva capacità previsionale del modello proposto, basterebbe calcolare l’errore di previsione e il livello di accuratezza:

valutare l’effettiva capacità previsionale del modello proposto

Il modello ha riscontrato un’accuratezza previsionale in media pari al 95,25% con un errore che si attesta intorno al 4,75%. Dallo studio dei risultati si può dedurre che il Model Quantile ha rilevato una capacità previsionale elevata, che conferma l’efficacia del modello per qualsiasi tipo di analisi.

Un’altra applicazione della funzione Model Quantile è quella di stimare i valori limite che definiscono la variabile target, ovvero generare un intervallo di confidenza previsionale, dove il quantile è fissato al 95-esimo percentile. Questo significa prevedere il valore limite per l’indicatore analizzato, ovvero stimare che i valori futuri non eccederanno quelli predetti con un intervallo di confidenza del 95% (solamente nel 5% dei casi si possono ottenere dei valori più elevati).

Model Quantile

  • La barra orizzontale verde segna il limite superiore predetto;
  • Il grafico a barre indica i valori a consuntivo delle vendite;
  • L’area grigia definisce rispettivamente il 70% ed il 90% del valore predetto, in modo da visualizzare l’incidenza percentuale raggiunta dalle vendite rispetto al limite superiore calcolato dal modello.

Un’applicazione del Model Percentile

L’esempio proposto si basa sull’analisi delle vendite e del profitto relative a tutti gli ordini effettuati in America nel periodo compreso tra il 2017 ed il 2020.
L’obiettivo è quello di stimare il percentile di riferimento per ogni combinazione dei valori ottenuti.

Il grafico presente nella visualizzazione seguente rappresenta uno scatter-plot tra la misura del profitto (asse delle ordinate) e quella delle vendite (asse delle ascisse).
Per semplificare ulteriormente l’analisi, i risultati del modello sono stati clusterizzati in range di percentili in base al colore:

scatter-plot tra la misura del profitto e quella delle vendite

Il criterio utilizzato per definire i valori limite dei cluster, si basa sulla definizione di percentile o quantile (per ulteriori informazioni Clicca qui):

ad esempio, considerando il cluster <20th & >80th percentile i valori minori del 20-esimo percentile e maggiori dell’80-esimo percentile, vengono considerati equiprobabili, in quanto entrambi si lasciano rispettivamente a sinistra e a destra il 20% delle osservazioni. 

Dallo studio dei risultati possiamo constatare che le combinazioni dei valori di colore blu che coincidono con il range di percentili vicini alla mediana 50th-percentile +-10, sono quelli con la più alta probabilità di verificarsi nel futuro; mentre i valori appartenenti al cluster <10th & >90th percentile evidenziati con il colore arancione, sono meno probabili e definiti outlier.

Conclusioni

Dall’analisi dei risultati ottenuti attraverso l’applicazione delle nuove funzioni predittive disponibili in Tableau Desktop 2020.3, si può concludere che il Model Quantile ed il Model Percentile sono dei modelli previsionali efficienti.

Con il rilascio di queste due funzioni è stato segnato da Tableau Software un avanzamento significativo nell’ambito della Predictive Analytics, attraverso la possibilità di implementare in modo semplice ed interattivo modelli previsionali complessi, applicati direttamente ai propri dati all’interno della Dashboard.