Costruire una rete neurale convoluzionale

Contenuti

Questo articolo è stato pubblicato nell'ambito del Blogathon sulla scienza dei dati

Este artículo tiene como objetivo explicar la convolucional neuronale rosso y cómo compilar CNN con la biblioteca TensorFlow Keras. Questo articolo tratterà i seguenti argomenti.

Primero analicemos la neuronale rosso convolucional.

Convolucional neuronale rosso (CNN)

Il apprendimento profondo es un subconjunto muy importante del aprendizaje automático debido a su alto rendimiento en varios dominios. La convolucional neuronale rossa (CNN) è un potente tipo di apprendimento profondo per l'elaborazione delle immagini che viene spesso utilizzato nella visione artificiale e comprende il riconoscimento di immagini e video insieme a un sistema di raccomandazione e all'elaborazione del linguaggio naturale (PNL).

CNN utiliza un sistema multicapa que consta de la livello di input, il Livello di output y una capa oculta que comprende múltiples capas convolucionales, strati raggruppati, strati completamente connessi. Discuteremo tutti i livelli nella prossima sezione dell'articolo mentre spieghiamo la costruzione della CNN.

Discutiamo la costruzione della CNN utilizzando la libreria Keras insieme a una spiegazione di come funziona la CNN.

edificio della CNN

Useremo il Set di dati di imaging delle cellule della malaria. Questo set di dati è composto da 27,558 imaging microscopico del campione di sangue. Il set di dati è composto da 2 cartelle: cartelle: parassitato e non infetto. Immagini di esempio

un) campione di sangue parassitato

B) Campione di sangue non infetto

Discuteremo della costruzione della CNN insieme alla CNN lavorando su quanto segue 6 Passi:

passo 1: importa le librerie richieste

passo 2: inicializar CNN y agregar una copertina convolutiva

passo 3: operazione di raggruppamento

passo 4: aggiungi due strati convolutivi

passo 5 – Operazione di spianatura

passo 6: livello e livello di output completamente connessi

Queste 6 i passaggi spiegheranno come funziona la CNN, mostrato nella seguente immagine:

55796cnn-9342100

Ora, analizziamo ogni passaggio:

1. Importa le librerie richieste

Per favore, vedere il collegamento sottostante per spiegazioni dettagliate sui moduli Keras.

https://keras.io/getting_started/

Codice Python:

From tensorflow.keras.layers import Input, Lambda, Denso, Appiattire,Conv2D
da tensorflow.keras.models import Model
da tensorflow.keras.applications.vgg19 import VGG19
da tensorflow.keras.applications.resnet50 import preprocess_input
da tensorflow.keras.preprocessing import image
da tensorflow.keras.preprocessing.image import ImageDataGenerator,load_img
da tensorflow.keras.models import Sequential
importa numpy come np
da glob import glob
importa matplotlib.pyplot come plt
da tensorflow.keras.layers import MaxPooling2D

2. Inizializza la CNN e aggiungi un livello convoluzionale

Codice Python:

modello=Sequenziale()

modello.aggiungi(Conv2D(filtri=16,kernel_size=2,padding="stesso",attivazione="riprendere",input_shape=(224,224,3)))

Per prima cosa dobbiamo avviare la classe sequenziale poiché ci sono diversi livelli per costruire CNN e tutti devono essere in sequenza. Quindi aggiungiamo il primo livello convoluzionale in cui dobbiamo specificare 5 argomenti. Quindi, Analizziamo ogni argomento e il suo scopo.

· Filtri

Lo scopo principale della convoluzione è trovare le caratteristiche nell'immagine usando un rilevatore di caratteristiche. Dopo, mettili su una mappa delle caratteristiche, che conserva i tratti distintivi delle immagini.

Il rilevatore di caratteristiche, che è noto come filtro, anche inizializzato casualmente e poi, dopo tante iterazioni, viene selezionato il parametro della matrice di filtro che sarà il migliore per separare le immagini. Ad esempio, l'occhio, naso, eccetera. degli animali sarà considerata una caratteristica che viene utilizzata per classificare le immagini utilizzando filtri o rilevatori caratteristici. Qui stiamo usando 16 funzioni.

· Kernel_size

Kernel_size si riferisce alla dimensione dell'array di filtri. Qui stiamo usando una dimensione del filtro di 2 * 2.

· Riempimento

67425pad-3670102

Discutiamo qual è il problema con la CNN e come l'operazione di riempimento risolverà il problema.

un. Per un'immagine in scala di grigi (nxn) e un filtro / nucleo (fxf), le dimensioni dell'immagine risultante da un'operazione di convoluzione è (n – F + 1) X (n – F + 1).

Quindi, ad esempio, un'immagine di 5 * 7 e una dimensione del nucleo del filtro di 3 * 3, il risultato dell'output dopo l'operazione di convoluzione sarebbe una dimensione di 3 * 5. Perciò, l'immagine si restringe ogni volta che viene eseguita l'operazione convoluzionale.

B. Pixel, situato negli angoli, hanno un contributo molto piccolo rispetto ai pixel nel mezzo.

Quindi, per mitigare questi problemi, viene eseguita l'operazione di riempimento. L'imbottitura è un semplice processo di aggiunta di strati con 0 oh -1 alle immagini in ingresso per evitare i problemi sopra menzionati.

Qui stiamo usando Padding = Stessi argomenti, che descrive che le immagini di output hanno le stesse dimensioni delle immagini di input.

· Funzione triggerriprendere

94297reluuu-8785187

Poiché le immagini non sono lineari, fornire non linearità, il función de activación relu se aplica después de la operación convolucional.

Relu significa funzione di attivazione lineare rettificata. La funzione Relu genererà l'input direttamente se è positivo; altrimenti, genererà zero.

· Modulo di input

Questo argomento mostra la dimensione dell'immagine: 224 * 224 * 3. Visto che le immagini in formato RGB sono così, la tercera dimensione de la imagen es 3.

3. Funzionamento della piscina

Codice Python:

modello.aggiungi(MaxPooling2D(pool_size=2))

Dobbiamo applicare l'operazione di raggruppamento dopo aver inizializzato la CNN. Il clustering è un'operazione di downsampling dell'immagine. Il livello di raggruppamento viene utilizzato per ridurre le dimensioni delle mappe di caratteristiche. Perciò, la capa Pooling reduce la cantidad de parametri a aprender y reduce el cálculo en la red neuronal.

68836ppppppppppp-9351255

Le operazioni future vengono eseguite su entità di riepilogo create dal livello di raggruppamento. invece di feature localizzate con precisione generate dal livello di convoluzione. Questo porta al modello più robusto a variazioni nell'orientamento della caratteristica nell'immagine..

Ci sono principalmente 3 tipi raggruppamento: –

1. Raggruppamento massimo

2. Raggruppamento medio

3. Raggruppamento globale

4. Aggiungi due livelli convolutivi

Per aggiungere altri due livelli convolutivi, dobbiamo ripetere i passaggi 2 e 3 con una leggera modifica nel numero di filtri.

Codice Python:

modello.aggiungi(Conv2D(filtri=32,kernel_size=2,padding="stesso",attivazione ="riprendere"))
modello.aggiungi(MaxPooling2D(pool_size=2))
modello.aggiungi(Conv2D(filtri=64,kernel_size=2,padding="stesso",attivazione="riprendere"))
modello.aggiungi(MaxPooling2D(pool_size=2))

Modifichiamo il 2Nord Dakota e 3rd strati convoluzionali con numero di filtro 32 e 64 rispettivamente.

5. Operazione di spianatura

Codice Python:

modello.aggiungi(Appiattire())

L'operazione di appiattimento consiste nel convertire il set di dati in una matrice 1-D per entrare nel livello successivo, che è lo strato completamente connesso.

36841tttttt-6506254

Dopo aver terminato il 3 Passi, ora abbiamo raggruppato la mappa delle caratteristiche. Ora stiamo appiattendo la nostra uscita dopo due passaggi in colonna. Perché abbiamo bisogno di inserire questi dati 1-D in un livello di rete neurale artificiale.

6. Livello completamente connesso e livello di output

L'output dell'operazione di appiattimento funziona come input per la rete neurale. L'obiettivo della rete neurale artificiale rende la rete neurale convoluzionale più avanzata e abbastanza in grado di classificare le immagini.

45580sssss-7571933

Qui stiamo usando una classe densa dalla libreria Keras per creare un livello completamente connesso e un livello di output.

Codice Python:

modello.aggiungi(Denso(500,attivazione="riprendere"))

modello.aggiungi(Denso(2,attivazione="softmax"))

La funzione di abilitazione di softMax viene utilizzata per creare il livello di output. Analizziamo la funzione di attivazione di softmax.

Funzione di attivazione Softmax

59812sssssssss-1488041

Viene utilizzato come ultima funzione di attivazione di una rete neurale per portare l'output della rete neurale a una distribuzione di probabilità sulle classi di previsione. L'output di Softmax è nelle probabilità di ogni possibile risultato per prevedere la classe. La somma delle probabilità deve essere una per tutte le possibili classi di previsione.

Ora, analicemos el addestramento y la evaluación de la red neuronal convolucional. Discuteremo questa sezione in 3 Passi; –

passo 1: compilare il modello CNN

passo 2: adattare il modello al training set

passo 3: valutare il risultato

passo 1: compilare il modello CNN

Riga di codice

modello.compila (perdita = 'categorical_crossentropy', ottimizzatore = 'adam', metriche =['precisione'])

Qui stiamo usando 3 argomenti: –

· Funzione di perdita

Stiamo usando il categorical_crossentropy funzione di perdita utilizzata nel compito di classificazione. Esta pérdida es una muy buena misura de cuán distinguibles son dos distribuciones de probabilidad discretas entre sí.

Per favore, Fare riferimento al collegamento sottostante per una descrizione dettagliata dei diversi tipi di funzione di perdita:

https://machinelearningmastery.com/how-to-choose-loss-functions-when-training-deep-learning-neural-networks/

· Ottimizzatore

stiamo usando Adam Optimizer utilizzato per aggiornare i pesi della rete neurale e il tasso di apprendimento. Gli ottimizzatori vengono utilizzati per risolvere i problemi di ottimizzazione riducendo al minimo la funzione.

Per favore, vedere il collegamento sottostante per una spiegazione dettagliata dei diversi tipi di ottimizzatore:

https://medium.datadriveninvestor.com/overview-of-different-optimizers-for-neural-networks-e0ed119440c3

· Argomenti metrici

Qui, stiamo usando la precisione come metrica per valutare le prestazioni dell'algoritmo della rete neurale convoluzionale.

passo 2: adattare il modello al training set

Riga di codice:

model.fit_generator(training_set,validation_data=test_set,epoche=50, steps_per_epoch = len(training_set), validation_steps=len(test_set) )

Stiamo adattando il modello CNN al set di dati di allenamento con 50 iterazioni e ogni iterazione ha diversi passaggi per addestrare e valutare i passaggi in base alla durata del test e al set di addestramento.

passo 3: – Valuta il risultato

Confrontiamo la precisione e la funzione di perdita per il set di dati di addestramento e test.

Codice: Grafico delle perdite

plt.trama(r.storia['perdita'], etichetta="train_loss")
plt.trama(r.storia['val_loss'], etichetta="val_loss")
plt.legend()
plt.mostra()
plt.savefig('LossVal_loss')

Produzione

84637llllllll-3357681

La perdita è la punizione per una cattiva previsione. L'obiettivo è ridurre al minimo la perdita di convalida. Un po' di overfitting è quasi sempre una buona cosa. Tutto ciò che conta, alla fine, è: è la perdita di convalida più bassa possibile.

Codice: Grafico di precisione del grafico

plt.trama(r.storia['precisione'], etichetta="treno acc")
plt.trama(r.storia['val_accuratezza'], etichetta="val acc")
plt.legend()
plt.mostra()
plt.savefig('AccVal_acc')

Produzione

28356aaaaaaa-7616326

L'accuratezza è una metrica per valutare i modelli di classificazione. Informalmente, la precisione è la frazione di previsioni che il nostro modello ha ottenuto correttamente. Qui, possiamo vedere che la precisione è vicina a 90% nel test di convalida che mostra che un modello CNN sta funzionando bene su metriche di precisione.

Grazie per aver letto! Buon apprendimento profondo!

Riferimenti:

1. https://www.superdatascience.com/

2. https://www.youtube.com/watch?v=H-bcnHE6Mes

A proposito di me :

Soy Jitendra Sharma, stagista in data science presso Nabler, y me dedico a PGDM-Big Data Analytics del Goa Institute of Management. Puoi contattarmi tramite LinkedIn e Github.

Il supporto mostrato in questo articolo non è di proprietà di DataPeaker e viene utilizzato a discrezione dell'autore.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.