Che cos'è l'analisi predittiva?? Una guida introduttiva

Contenuti

Questo articolo è stato pubblicato nell'ambito del Blogathon sulla scienza dei dati

introduzione

statistiche, apprendimento automatico, la modellazione matematica e l'intelligenza artificiale sono note come analisi predittiva. Con l'aiuto dei dati passati, fa previsioni. Usiamo l'analisi predittiva nella nostra quotidianità senza pensarci troppo. Ad esempio, prevedere le vendite di un articolo (ad esempio, fiori) in un mercato per un giorno particolare. Se è San Valentino, Le vendite di rose sarebbero alte! Possiamo facilmente dire che le vendite di fiori sarebbero più alte nei giorni festivi che nei giorni normali.

Nell'analisi predittiva, troviamo i fattori responsabili, raccogliamo dati, applichiamo tecniche di machine learning, estrazione dei dati, modellazione predittiva e altre tecniche analitiche per prevedere il futuro. Le informazioni sui dati includono modelli, la relazione tra diversi fattori che potrebbero essere precedentemente sconosciuti. Svelare quelle conoscenze nascoste vale più di quanto pensi. Le aziende utilizzano l'analisi predittiva per migliorare il proprio processo e raggiungere i propri obiettivi. Le informazioni ottenute da dati strutturati e non strutturati possono essere utilizzate per analisi predittive.

In che modo le statistiche sui dati aiutano?

Negli ultimi anni, Le organizzazioni hanno scelto di raccogliere grandi quantità di dati assumendo che, se raccolgono una quantità sufficiente, alla fine porterà a informazioni aziendali rilevanti. Anche Instagram e Facebook forniscono informazioni sugli account aziendali. Ma, i dati nella loro forma grezza sono inutili, non importa quanto siano grandi. Più dati da analizzare, più difficile è separare le preziose informazioni aziendali da quelle irrilevanti. Una strategia di analisi dei dati si basa sul reale potenziale dei dati, devi prima determinare perché li stai usando e quale valore commerciale ti aspetti di ottenere da loro. Prossimo, spiega come ottenere preziose informazioni dai dati e come utilizzarle.

1. Definizione della dichiarazione del problema / obiettivo aziendale.

Definire i risultati del progetto, I risultati, la portata dello sforzo, obiettivi aziendali, preparare un questionario per i dati da ottenere in base all'obiettivo aziendale.

2. Raccolta dati basata sulle risposte alle domande create sulla base dell'affermazione del problema.

In base al questionario, raccogliere le risposte come set di dati.

3. Integra i dati da più fonti.

Il data mining per l'analisi predittiva prepara i dati da più fonti per l'analisi. Ciò fornisce una visione completa delle interazioni con i clienti.

4. Analisi dei dati con strumenti / software di analisi. Possiamo visualizzare i dati per osservare modelli e relazioni tra vari fattori.

L'analisi dei dati è il processo di ispezione, ripulire, trasformare e modellare i dati per scoprire informazioni utili per giungere a una conclusione.

5. Convalidare le ipotesi, ipotesi e verificarle utilizzando modelli statistici.

L'analisi statistica permette di validare le ipotesi, ipotesi e verificarle utilizzando modelli statistici. Le ipotesi si basano sulla dichiarazione del problema, formato durante l'EDA.

6. Generazione di modelli

Il modello è generato con algoritmi per automatizzare il processo con i nuovi dati combinati con i dati esistenti. Diversi modelli possono anche essere combinati per risultati migliori.

7. Implementa il modello per generare previsioni e monitorarne l'accuratezza.

L'implementazione del modello predittivo offre la possibilità di implementare i risultati analitici nel processo decisionale quotidiano per ottenere risultati, report e output automatizzando le decisioni basate sulla modellazione.

Cosa c'è di più, gestiamo e monitoriamo le prestazioni del modello per garantire che fornisca i risultati attesi.

analisi predittiva

Dati errati o incompleti possono portare a modelli scadenti e accuratezza causando il caos. Ecco perché è estremamente necessario disporre di un set di dati adeguato per ottenere informazioni e addestrare il modello.. L'analisi predittiva ha le sue sfide, ma può portare a risultati di business inestimabili, incluso l'acquisizione di clienti prima che se ne vadano, ottimizzazione del budget commerciale e soddisfazione della domanda del cliente.

Modelli e algoritmi

Varie tecniche di dominio, compreso l'apprendimento automatico, Estrazione dei dati, le statistiche, analisi e modellazione, sono utilizzati nell'analisi predittiva. Gli algoritmi predittivi possono essere ampiamente classificati in due gruppi: modelli di machine learning e modelli di deep learning. Alcuni di loro sono descritti in questo articolo. Anche se hanno i loro meriti e demeriti, un grande merito di tutti loro è che sono riutilizzabili e possono essere addestrati utilizzando algoritmi con regole specifiche dell'azienda. L'analisi predittiva è un processo iterativo che implica la raccolta, pre-elaborazione, modellare e implementare i dati per ottenere risultati. Possiamo automatizzare il processo per fornirci nuove previsioni basate sui nuovi dati che vengono alimentati regolarmente nel tempo..

Una volta addestrato un modello, possiamo inserire nuovi dati per ottenere previsioni e non è necessario allenarsi più e più volte, ma uno svantaggio è che ha bisogno di molti dati per essere addestrato. Poiché l'analisi predittiva si basa su algoritmi di apprendimento automatico, richiede una corretta classificazione dei dati sulle etichette, che cosa, altrimenti, causerebbe scarse prestazioni e precisione. La generalizzazione è un problema, poiché il modello ha poca capacità di trasferire i suoi risultati da un caso all'altro. Sebbene ci siano alcuni problemi di applicabilità quando si tratta di risultati derivati ​​da un modello di analisi predittiva, può essere risolto con determinati metodi, come il trasferimento di apprendimento.

Modelli di analisi predittiva

  1. Modello di classificazione

È uno dei modelli più semplici. Classifica i nuovi dati in base a ciò che hai appreso dai dati storici. Sono i migliori per la classificazione binaria quando si risponde a domande binarie come Sì / No, Vero / Impostore, ma possono essere utilizzati anche per la classificazione multiclasse. Alberi decisionali, le macchine vettoriali di supporto sono alcuni algoritmi di classificazione.

P.ej. : L'approvazione del prestito è un classico caso d'uso di un modello di classificazione. Un altro esempio sono i messaggi / e-mail di rilevamento dello spam.

789891_sxautv4lcotjlxxc8q3kyw-9160995
  1. Modello di clustering

Un modello di clustering classifica i punti dati in gruppi in base alla somiglianza degli attributi. Esistono molti algoritmi di clustering, ma nessun algoritmo può essere considerato il migliore per tutti i casi d'uso. È un algoritmo di apprendimento non supervisionato, a differenza della classificazione supervisionata.

Ad esempio: Raggruppa gli studenti di una scuola in base alla loro posizione in una città per i servizi di trasporto. Raggruppa i clienti in base alle preferenze degli articoli per consigliare prodotti correlati ai loro interessi.

  1. Modello di previsione

Essendo uno dei modelli di analisi predittiva più utilizzati, si occupa della previsione dei valori metrici, stimare un valore numerico per i nuovi dati sulla base di quanto appreso dai dati storici. Può essere applicato ogni volta che sono disponibili dati numerici.

Non .: Previsione del traffico sulla strada principale di una città in periodi diversi. Negozi che stimano la disponibilità dei prodotti nel loro magazzino.

  1. Modello anomalo

Come suggerisce il nome, si basa su inserimenti di dati anomali nel tuo set di dati. Un valore anomalo potrebbe essere un errore di immissione dei dati, Errore di misurazione, errore sperimentale, intenzionale, errore di elaborazione dei dati, errore di campionamento o errore naturale. Sebbene i valori anomali possano causare prestazioni e precisione scadenti, alcuni ci aiutano a trovare novità o osservare nuove deduzioni.

Non .: Furto di carta di credito / debito.

945300_r9u16eecszhpjh4o_-460x324-5522126
  1. Modello serie temporale

Può essere utilizzato per qualsiasi sequenza di punti dati con un periodo di tempo come parametro di input. Usa i dati passati per sviluppare una metrica numerica e prevedere i dati futuri utilizzando quella metrica.

Non .: previsioni del tempo, mercato azionario / previsione del prezzo della criptovaluta.

Alcuni algoritmi predittivi comuni sono le foreste casuali, modello lineare generalizzato, motivo sfumato rinforzato, raggruppamento di K-mezzi e Prophet. La foresta casuale è una combinazione di alberi decisionali, in cui cercano di ottenere il minor errore possibile utilizzando la tecnica di “embolsado” oh “impulso”. Il modello lineare generalizzato è una variante più complessa del modello lineare generale che si allena molto rapidamente. La variabile di risposta può avere qualsiasi forma di tipo di distribuzione esponenziale che fornisce una chiara comprensione di come i predittori influenzano il risultato..

Sebbene siano resistenti al sovradattamento, richiedono un ampio set di dati per l'addestramento e sono suscettibili di valori anomali. Gradient Boosted Model è un modello di previsione basato su un insieme di alberi decisionali. A differenza delle foreste casuali, costruisci un albero alla volta e correggi i bug precedenti mentre costruisci un nuovo albero. K-means è utile quando si cerca di implementare un piano personalizzato su un set di dati di grandi dimensioni. Utilizzato nei modelli di raggruppamento. Il profeta è un algoritmo utilizzato nelle serie temporali e nei modelli di previsione. Non è solo automatico, incorpora anche utili euristiche e ipotesi. È famoso per essere veloce, affidabile e robusto.

alcuni di noi

L'analisi predittiva come detto ha già molte applicazioni in diversi domini. Per dirne alcuni,

  1. Assistenza sanitaria
  2. Analisi della collezione
  3. Intercettazione di una frode
  4. Gestione del rischio
  5. Marketing diretto
  6. Cruz-

Quindi, In che modo esattamente aiutano nei tuoi domini?? Riceviamo avvisi quando accediamo al nostro account Gmail da un nuovo dispositivo. Riceviamo avvisi quando utilizziamo le nostre carte di credito / addebito in posti nuovi. Come lo rilevano?? Con l'analisi predittiva, Gli esaminatori delle frodi prendono alcune serie di variabili predeterminate che sono note per essere coinvolte in eventi di frode passati e inseriscono tali variabili nei processi per determinare la probabilità che risultati o eventi futuri siano o meno frodi. Supponi di utilizzare regolarmente le tue carte di credito in Kerala, quando la tua carta di credito viene utilizzata a Nuova Delhi è un possibile caso di frode. Commonwealth Bank utilizza l'analisi per prevedere la probabilità di attività fraudolenta per una determinata transazione prima che venga autorizzata., all'interno del 40 millisecondi dopo l'inizio della transazione.

Oltre a rilevare le frodi sui sinistri, l'industria dell'assicurazione sanitaria sta adottando misure per identificare i pazienti a più alto rischio di malattie croniche e trovare i migliori interventi. Script espressi, una grande azienda di benefici farmaceutici, utilizza i test per identificare coloro che non aderiscono ai trattamenti prescritti, che genera risparmi significativi. Le app di analisi predittiva analizzano la spesa, utilizzo e altri comportamenti dei clienti, portando a una vendita incrociata efficiente o alla vendita di prodotti aggiuntivi ai clienti esistenti per un'organizzazione che offre più prodotti.

Circa l'autore

io sono keerthana, uno studente di scienze dei dati affascinato dalla matematica e dalle sue applicazioni in altri domini. Sono anche interessato a scrivere articoli relativi alla matematica e alla scienza dei dati. Puoi connetterti con me su LinkedIn e Instagram. Controlla i miei altri articoli qui.

Il supporto mostrato in questo articolo non è di proprietà di DataPeaker e viene utilizzato a discrezione dell'autore.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.