Algoritmo ANN | Come funziona la rete neurale artificiale

Contenuti

Nell'ultimo post (Clicca qui), parliamo brevemente delle basi della tecnica ANN. Ma prima di usare la tecnica, un analista deve sapere, Come funziona effettivamente la tecnica?? Anche quando non è richiesto un rinvio dettagliato, il framework dell'algoritmo deve essere noto. Questa conoscenza serve a molteplici scopi:

  • Primo, ci aiuta a capire l'impatto dell'aumento / riduci il set di dati verticalmente o orizzontalmente nel tempo di calcolo.
  • Al secondo posto, ci aiuta a capire le situazioni o i casi in cui il modello si adatta meglio.
  • Al terzo posto, Ci aiuta anche a spiegare perché un determinato modello funziona meglio in determinate impostazioni o situazioni..

Este post le proporcionará una comprensión básica del marco de la neuronale rosso artificial (ANN). Non entreremo nel bypass vero e proprio, ma le informazioni fornite in questo post saranno sufficienti per farti apprezzare e mettere in pratica l'algoritmo. Alla fine del post, inoltre presenterò le mie opinioni sui tre scopi fondamentali della comprensione di qualsiasi algoritmo precedentemente menzionato.

Formulazione della rete neurale

Inizieremo con la comprensione della formulazione di una semplice rete neurale a strati nascosti. Se puede representar una red neuronal simple como se muestra en la próxima figura:

ANA

I collegamenti tra i nodi sono la scoperta più cruciale in una ANN. Torneremo su "come trovare il peso di ciascun collegamento" dopo aver discusso il quadro generale. Gli unici valori noti nel diagramma sopra sono gli ingressi. Chiamiamo gli ingressi I1, I2 e I3, stati nascosti come H1, H2.H3 e H4, uscite come O1 e O2. I pesi dei collegamenti possono essere indicati con la seguente notazione:

W (I1H1) è il peso del collegamento tra i nodi I1 e H1.

Di seguito è riportato il quadro in cui funzionano le reti neurali artificiali (ANN):

Diagramma di flusso ANN

Pochi dettagli statistici sul framework

Ogni calcolo di collegamento in una rete neurale artificiale (ANN) è equivalente. Generalmente, assumiamo un legame sigmoideo tra le variabili di input e il tasso di attivazione dei nodi nascosti o tra i nodi nascosti e il tasso di attivazione dei nodi di output. Prepariamo l'equazione per trovare il tasso di attivazione di H1.

Logit (H1) = W (I1H1) * I1 + W (I2H1) * I2 + W (I3H1) * I3 + Costante = f

=> P (H1) = 1 / (1 + e ^ (- F))

Ecco come appare il collegamento sigmoideo:

SigmoidFunction_701

Come vengono ricalibrati i pesi?? Una breve nota

La ricalibrazione dei pesi è una procedura semplice, ma a lungo. Gli unici nodi in cui conosciamo il tasso di errore sono i nodi di output. La recalibración de pesos en el vínculo entre el nodo oculto y el nodo de salida es una función de esta tasa de error en los nodos de salida. Ma, Come troviamo il tasso di errore nei nodi nascosti?? Si può statisticamente dimostrare che:

Errore @ H1 = W (H1O1) *[e-mail protetta] + W (H1O2) *[e-mail protetta]

Usando questi errori, possiamo ricalibrare i pesi del collegamento tra nodi nascosti e nodi di input in modo equivalente. Imagine que este cálculo se realiza varias veces para cada una de las observaciones del conjunto de addestramento.

Le tre domande fondamentali

Qual è la correlazione tra il tempo consumato dall'algoritmo e il volume dei dati? (rispetto ai modelli tradizionali come la logistica)?

Come menzionato in precedenza, per ogni osservazione, ANN esegue più ricalibrazioni per ogni peso di collegamento. Perché, il tempo impiegato dall'algoritmo aumenta molto più velocemente di altri algoritmi tradizionali per lo stesso aumento del volume di dati.

In quale situazione si adatta meglio l'algoritmo??

La ANN è usata raramente per la modellazione predittiva. Il motivo è che le reti neurali artificiali (ANN) di solito cercano di adattare troppo il legame. La ANN viene generalmente utilizzata nei casi in cui ciò che è accaduto in passato si ripete quasi esattamente nello stesso modo. Come esempio, diciamo che stiamo giocando a black jack contro un computer. Un avversario intelligente basato su ANN sarebbe un ottimo avversario per questo caso (supponendo che possano mantenere basso il tempo di calcolo). Col tempo, ANN si preparerà per tutti i possibili casi di flusso di carte. E dal momento che non stiamo mescolando le carte con un mazziere, ANN sarà in grado di memorizzare ogni chiamata. Perché, è una sorta di tecnica di apprendimento automatico che ha una memoria enorme. Ma non funziona bene nel caso in cui la popolazione del punteggio sia significativamente diversa rispetto al campione di allenamento. Come esempio, se ho intenzione di indirizzare un cliente per una campagna utilizzando la sua precedente risposta da una ANN. Probabilmente userò la tecnica sbagliata, poiché potresti aver regolato eccessivamente il collegamento tra la soluzione e altri predittori.

Per la stessa ragione, funziona molto bene in caso di accredito immagine e accredito vocale.

Ciò che rende ANN un modello molto forte quando si tratta di memorizzazione??

Reti neurali artificiali (ANN) hanno molti coefficienti diversi, che puoi sfruttare al meglio. Perché, può gestire molta più variabilità rispetto ai modelli tradizionali.

Il post ti è stato utile?? Hai usato altri strumenti di machine learning di recente?? Hai intenzione di utilizzare ANN su uno qualsiasi dei tuoi problemi aziendali?? Se è così, dicci come pensi di farlo.

Se ti piace quello che hai appena letto e vuoi continuare il tuo apprendimento analitico, iscriviti alle nostre email, Seguici su Twitter o come il nostro Facebook pagina.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.