L’analisi predittiva, in inglese predictive analytics, è uno strumento particolarmente avanzato utile per estrarre valore dai Big Data. Lo scopo è quello di analizzare il passato con l’ausilio dell’Intelligenza Artificiale per capire cosa potrà accadere in futuro.
I sistemi di predictive analytics comportano evidenti vantaggi in svariati settori poiché prevedere quel che riserva il futuro è la chiave di volta per incrementare le performance dell’azienda.
Oggi i modelli predittivi per l’analisi dei dati si basano su algoritmi statistici e tecniche di machine learning, indispensabili per trarre profitti ed avere un vantaggio competitivo non indifferente.
Ma in cosa consiste precisamente la predictive analytics, come funziona e soprattutto, in quali settori trova applicazione?
Storia e sviluppo della predictive analytics
La predictive analytics viene impiegata per estrarre predizioni partendo da dati storici. L’obiettivo principale è quello di costruire degli schemi anticipatori attendibili di quel che può succedere in futuro ed usarli in diversi ambiti per ricavare una maggiore efficienza e stime più accurate.
Gli algoritmi utilizzati dall’analisi predittiva si fondano su dati precedentemente raccolti tramite differenti strumenti e canali, i quali vengono poi implementati con complessi modelli di machine learning o di altri sistemi ancora più sofisticati.
Naturalmente la qualità dei risultati finali è strettamente connessa alla qualità dei dati di partenza e dalla scelta dell’analisi statistico usato per l’elaborazione.
In tal senso, si opera un salto da ciò che è conosciuto e certo a quello che è probabile ed è per questo che sono necessari tools e tecniche alternative da quelle impiegate per indagare il noto. Resta però una costante comune, ovvero l’importanza dei dati e dell’abilità di estrarli e manipolarli.
L’attività di predictive analytics è ormai in uso da tantissimi anni, ma soltanto con l’avvento di computer più veloci e potenti è stato possibile sfruttarne in pieno tutto il potenziale.
Negli Anni Quaranta i padri dell’informativa moderna che hanno gettato le basi della modellazione computazionale e della programmazione lineare hanno dato un notevole contributo all’interesse verso l’analisi predittiva.
Il primo esempio è il famoso Progetto Manhattan sulle armi atomiche, portato a termine attraverso l’analisi manuale chiamata ‘simulazione Monte Carlo’, utilizzata per prevedere il comportamento degli atomi durante la reazione nucleare.
Negli Anni Cinquanta l’evoluzione dei computer è andata avanti parallelamente alla programmazione non lineare e all’euristica computerizzata. In questi anni nascono anche i primi dischi rigidi che gettano le fondamenta per i moderni database.
Tra gli Anni Settanta ed Ottanta la predictive analytics è usata per prevedere i prezzi del mercato azionario, mentre studiosi come E.F. Codd hanno compreso le basi teoriche dei database relazionali, tra cui lo Structured Query Language (SQL) e l’interfaccia di programmazione delle applicazioni (API).
Solo negli Anni Novanta e Duemila si assiste all’ascesa del machine learning (la branca dell’AI che automatizza la costruzione di modelli analitici) e del cloud computing che permettono di definire ampi database di informazioni per ottimizzare le esperienze marketing e nel settore digitale.
Come funziona la predictive analytics
I meccanismi predittivi messi in campo dalla predictive analytics sfruttano risultati conosciuti per comporre un modello che possa essere impiegato per prevedere valori di dati nuovi.
Sono dunque diversi dai modelli descrittivi che servono a capire che cos’è successo nel passato o da quelli diagnostici che aiutano a comprendere perché qualcosa è accaduto.
La digitalizzazione è stata quindi fondamentale per raggiungere tali risultati e coinvolge sia la dimensione interna che esterna all’ecosistema di ogni singola azienda.
Infatti, le imprese possono avere accesso a immense quantità di dati strutturati e non strutturati, dai quali ricavare valore e decisioni strategiche.
Tutti questi dati devono essere preparati prima di essere immessi nei modelli di analisi, che sempre più spesso di affidano agli algoritmi di AI e di machine learning (ML). Proprio l’algoritmo ML consente al programma di imparare dall’esperienza, cioè a reagire all’aggiunta di dati nuovi.
Nello specifico, ci sono due tipologie di modelli predittivi: i modelli di classificazione e i modelli di regressione.
I primi prevedono l’appartenenza ad una classe e generano valori come vero/falso o decisioni relative alle categorie. Invece i modelli di regressione prevedono un numero, cioè una variabile dipendente o più variabili indipendenti come il ricavato di un cliente nell’anno seguente o dopo quanti mesi un componente di romperà.
Al di là però di questi modelli basilari, la predictive analytics si affida anche ad altri strumenti molto importanti:
- Alberi decisionali: si tratta di modelli di classificazione che suddividono le informazioni in sottoinsiemi secondo categorie di variabili di input per interpretare il processo decisionale di una persona. Ciascun ramo dell’albero rappresenta una scelta tra un certo numero di possibilità e le foglie indicano le decisioni. Gli alberi decisionali sono abbastanza facili da leggere e sono di aiuto per la selezione preliminare delle variabili.
- Regressione lineare e logistica: questo è uno dei sistemi statistici più diffusi. L’analisi della regressione va a stimare le relazioni che occorrono tra le variabili e permette di individuare pattern in gruppi di dati di ampie dimensioni. Comunemente viene impiegata per sapere come il prezzo influenzerà la circolazione di un bene.
- Reti neurali: si tratta di strumenti sofisticati capaci di modellare relazioni molto complesse. Il valore di tali sistemi risiede saper controllare relazioni non lineari all’interno dei dati. A volte le reti neurali sono utili per confermare i risultati ottenuti con tecniche più semplici come alberi decisionali e regressione o quando non si conosce una formula matematica che possa mettere in relazione input ed output.
- Analisi bayesiana: i sistemi bayesiani considerano i parametri come variabili casuali ed esprimono la probabilità in termini di gradi di fiducia, cioè secondo quanto si ritiene che l’evento sia vero. Con l’analisi bayesiana si parte da un presupposto a priori sulla distribuzione di probabilità di un parametro ignoto. Una volta ricevute le informazioni dai dati, il presupposto sul parametro sconosciuto si aggiorna.
- Modelli ensemble: i meccanismi di apprendimento ensemble sono generati istruendo diversi modelli simili ed unendo poi i loro risultati per avere una maggiore precisione, contenere la distorsione e trovare un modello ideale da impiegare con i nuovi dati.
- Gradient boosting: è una tecnica di machine learning che si fonda sul potenziamento del gradiente e va a ricampionare svariate volte i dati per produrre risultati che compongano una media ponderata del gruppo di dati ricampionato. Il gradient boosting non genera ipotesi sulla distribuzione dei dati ed è in grado di migliorare le stime prodotte dagli alberi decisionali.
- Minini quadrati parziali: è una tecnica statistica molto flessibile che può essere applicata su qualunque tipo di dati. Il sistema va a modellare relazioni tra input e output anche nell’eventualità in cui gli output siano correlati e fuorvianti o quando ci sono più output.
A cosa serve la predictive analytics?
Valorizzare i dati tramite l’AI e le tecniche di machine learning è determinante per le aziende che così possono valutare rischi e tendenze future per delineare piani di azione sempre più accurati e precisi, senza tralasciare nulla al caso.
Con l’analisi predittiva non si avrà certamente un’esatta previsione del futuro, ma di sicuro è un genere di approccio che permette di anticipare le difficoltà, reagendo in tempo e decidendo di conseguenza.
In altre parole, per le imprese si abbrevia il tempo che passa tra la conoscenza del problema e l’azione, diventando più efficaci ed efficienti sotto ogni aspetto. Il vantaggio più immediato è la predizione applicata ai processi operativi, i cui effetti sono facilmente percepibili.
Integrando i dati interni ed esterni si ottengono vantaggi a medio e lungo termine e proprio questa mole di informazioni consente di fare simulazioni predittive a sostengo del monitoraggio e degli adattamenti della strategia aziendale.
Non a caso i modelli predittivi riescono a mettere in relazione gruppi di algoritmi e dati per individuare eventuali anomalie rispetto ai modelli precedenti, segnalando errori o modifiche in atto. In tal modo è possibile prevedere situazioni future come scelte dei clienti, problemi e cambiamenti sui mercati.
Perché è importante la predictive analytics
Le più grandi aziende del mondo stanno adottando l’analisi predittiva per trovare una soluzione praticabile ai problemi più difficili ed individuare nuove opportunità di sviluppo.
In particolare, ci si affida alla predictive analytics per i seguenti scopi:
- Rilevare le frodi: combinare i differenti metodi di analisi dei dati può aiutare l’identificazione di schemi criminali definiti e prevenire gli cyberattacchi. Considerando l’elevato numero di frodi e tentativi di truffa, l’analisi comportamentale dà la possibilità di verificare in tempo reale le azioni avvenute in rete per riscontrare anomalie che potrebbero suggerire falle nella sicurezza ed eventuali attacchi hacker.
- Ottimizzare le campagne marketing: i modelli di predictive analytics sono usati per anticipare le risposte e gli ipotetici acquisti dei clienti e per favorire occasioni di cross-selling. Inoltre, tali analisi consentono alle imprese di fidelizzare ed accrescere il numero di clienti.
- Migliore gestione delle operazioni: tante società si servono dei sistemi predittivi per avere un’idea delle giacenze in magazzino e gestire al meglio tutte le risorse. Le compagnie aeree hanno abbracciato l’analisi predittiva per stabilire i prezzi dei loro biglietti. Oppure gli alberghi prevedono il numero di ospiti in una specifica notte in maniera da massimizzare la percentuale di occupazione delle camere.
- Contenimento dei rischi: la predictive analytics ha un ruolo centrale nell’abbattimento di potenziali rischi a carico dell’azienda. Infatti, i punteggi di affidabilità creditizia sono utilizzati come metro di valutazione sulla probabilità di insolvenza di un acquirente. Si parla così di credit score per riferirsi ai dati relativi all’affidabilità creditizia di un cliente. Altri usi in tal senso includono le riscossioni e gli indennizzi assicurativi.
Ambiti d’uso della predictive analytics
Come abbiamo visto, l’analisi predittiva al giorno d’oggi trova moltissimi campi di applicazione praticamente in ogni settore economico, dai servizi finanziari e fino all’industria.
I modelli predittivi sono di grande utilità per gestire magazzini, fissare prezzi, programmare la manutenzione, stabilire modelli di rischio del credito e portare a termine molte altre attività.
In aggiunta, le società ne fanno largo impiego per ridurre i pericoli provenienti dal web, massimizzare le operazioni ed ovviamente incrementare i profitti.
Vediamo allora quali sono i principali ambiti nei quali viene applicata la predictive analytics.
Banche e finanza
Il mondo della finanza vede in gioco enormi quantità di denaro e dati e si avvale dell’analisi predittiva per scovare frodi telematiche, calcolare il rischio di credito, sfruttare al meglio le opportunità di cross e up-selling ed attrarre nuovi clienti e investitori.
Per esempio, la Commonwealth Bank utilizza la predictive analytics per prevedere in anticipo le attività fraudolenti prima che le operazioni vengano autorizzate. Il tutto in appena 40 millisecondi dall’avvio della transazione.
Retail
I lavoratori del settore retail ormai raccolgono un numero sempre più consistente di informazioni sui clienti, sia online, con il tracciamento dei cookie, sia nella vita reale, controllando il modo nel quale le persone si muovono tra i reparti di un negozio.
Tra i dati tracciati non mancano quelli di contatto raccolti presso i punti vendita, le attività sui social media, gli articoli acquistati e la frequenza con cui si comprano certi prodotti.
Con l’analisi predittiva la grande distribuzione punta all’ottimizzazione delle scorte e alla previsione dei ricavi, passando attraverso il targeting dei clienti e l’analisi dei comportamenti.
Energia
In campo energetico la predictive analytics viene molto spesso usata per predire guasti alle apparecchiature, limitare i rischi per la sicurezza, migliorare le prestazioni ed individuare i futuri fabbisogni con ampio anticipo.
Ottimo esempio è la Salt River Project, la seconda azienda elettrica americana ed uno dei più grandi fornitori di acqua in Arizona. Le analisi predittive dei dati raccolti dai sensori delle macchine segnalano quando le turbine elettriche hanno bisogno di manutenzione.
Marketing
I modelli ricavati dall’analisi predittiva sono preziosi per gli esperti di marketing che devono proporre campagne sempre più efficaci e mirate al target di riferimento.
L’applicazione di tali strumenti di previsione favorisce soprattutto la classificazione dei lead, la fidelizzazione di nuovi clienti e la personalizzazione del messaggio. I dati servono quindi ad inviare promozioni al momento opportuno, costruire campagne ad hoc e sviluppare una migliore user experience.
Sanità
Gli ospedali e le strutture mediche di tutto il mondo sono oggetto di notevoli pressioni per ottimizzare le proprie risorse, molto esigue in taluni casi.
Per farlo, decidono di puntare sull’analisi predittiva, indispensabile per agevolare il processo decisionale ed operativo, coordinare le scorte e l’organico, gestire la supply chain e prevedere le fasi di manutenzione.
Infine, questi modelli predittivi sono importanti per rivelare segni di peggioramento nei pazienti e rendere più accurate le diagnosi ed i trattamenti medici.