Matematica per l'apprendimento automatico | Matematica per la scienza dei dati

Contenuti

Questo articolo è stato pubblicato nell'ambito del Blogathon sulla scienza dei dati

51102ml-8797358

Sei un aspirante data scientist che è affascinato da come funzionano le cose nel mondo della scienza dei dati e dell'apprendimento automatico?? Bene, congratulazioni per aver scelto il giusto percorso di carriera più adatto alle tue esigenze in questo momento. tuttavia, Sapevi che devi padroneggiare la matematica per l'apprendimento automatico e la scienza dei dati?? sì, hai sentito bene.

Non importa che tipo di rapporto di amore-odio hai avuto con la matematica a scuola.. I concetti di base che vengono utilizzati in matematica e statistica sono in realtà molto utili per prendere decisioni strategiche durante la progettazione di modelli di apprendimento automatico.. Quindi, se hai deciso di scegliere questa carriera nel campo della scienza dei dati, devi iniziare ad amare i concetti della matematica e implementarli nel tuo futuro, in quanto è uno dei prerequisiti per l'apprendimento automatico.

Qual è la correlazione tra machine learning e matematica??

18057whatsapp20image202021-05-3120at208-41-4320pm201-6071198

L'apprendimento automatico è tutto incentrato sulla matematica, che a sua volta aiuta a creare un algoritmo in grado di imparare dai dati per fare una previsione accurata.. La previsione potrebbe essere semplice come ordinare cani o gatti da un determinato insieme di immagini o che tipo di prodotti consigliare a un cliente in base agli acquisti precedenti.. Perciò, È molto importante comprendere correttamente i concetti matematici alla base di qualsiasi algoritmo di apprendimento automatico di base. così, ti aiuta a scegliere tutti gli algoritmi giusti per il tuo progetto nella scienza dei dati e nell'apprendimento automatico.

L'apprendimento automatico si basa principalmente su prerequisiti matematici, quindi finché riesci a capire perché viene usata la matematica, lo troverai più interessante. Con questo, capirai perché scegliamo un algoritmo di machine learning rispetto all'altro e come influisce sulle prestazioni del modello di machine learning.

Punti da trattare in questo post del blog

  1. Quali concetti matematici sono coinvolti nell'apprendimento automatico??

  2. Perché hai bisogno della matematica nei progetti di machine learning?

  3. Qual è il modo giusto per impararlo??

Nel post del blog di oggi, discuteremo esattamente tutti i concetti matematici necessari per imparare a padroneggiare i concetti di data science e machine learning. Impareremo anche perché usiamo la matematica nell'apprendimento automatico con alcuni esempi..

Iniziamo osservando le molte forme di matematica utilizzate nella scienza dei dati e nell'apprendimento automatico in modo da poter capire meglio ciò che è davvero necessario sapere sulla matematica per la professione di scienza dei dati..

Quali concetti matematici sono implementati nella scienza dei dati e nell'apprendimento automatico

L'apprendimento automatico si basa su quattro concetti critici ed è statistico, algebra lineare, probabilità e calcolo. Mentre i concetti statistici sono la parte centrale di ogni modello, il calcolo ci aiuta a imparare e ottimizzare un modello. L'algebra lineare è eccezionalmente utile quando si tratta di un grande set di dati e la probabilità aiuta a prevedere il sostentamento degli eventi che si verificheranno.. Questi sono i concetti matematici che incontrerai nella tua carriera di data science e machine learning abbastanza spesso..

Concetti matematici importanti per l'apprendimento automatico e la scienza dei dati:

  1. Algebra lineare

  2. Calcolo

  3. Teoria della probabilità

  4. Matematica discreta

  5. Statistiche

97735whatsapp20image202021-05-3120at208-41-4420pm-5736471

Concetto di algebra lineare nel machine learning:

Capire come costruire equazioni lineari è una componente fondamentale nello sviluppo di algoritmi di apprendimento automatico di base.. Questi saranno utilizzati per valutare e osservare la raccolta dei dati.. L'algebra lineare viene applicata negli algoritmi di apprendimento automatico nelle funzioni di perdita, regolarizzazione, matrici di covarianza, scomposizione dei valori singolari (SVD ·), operazioni matriciali e classificazione delle macchine vettoriali di supporto. Viene anche applicato in algoritmi di apprendimento automatico come la regressione lineare. Questi sono i concetti necessari per comprendere i metodi di ottimizzazione utilizzati per l'apprendimento automatico.

Per eseguire un'analisi dei componenti principali utilizzata per ridurre la dimensionalità dei dati, usiamo l'algebra lineare. L'algebra lineare è anche ampiamente utilizzata nelle reti neurali per l'elaborazione e la rappresentazione della rete.. Inutile dire che devi essere interessato all'algebra lineare, in quanto è ampiamente utilizzato nel campo della scienza dei dati.

tuttavia, non lasciarti intimidire da questo, poiché la comprensione dei concetti sarà importante, ma non è necessario essere un esperto di algebra lineare per risolvere la maggior parte dei problemi. Solo una solida conoscenza dei concetti sarà sufficiente. Math for Machine Learning di Marc Peter deisenroth è un libro eccellente che ti aiuterà a iniziare questo viaggio se all'inizio stai lottando con la matematica..

Calcolo nell'apprendimento automatico:

A molti studenti a cui non piaceva imparare il calcolo che è stato insegnato loro a scuola subirà un duro colpo., in quanto è parte integrante dell'apprendimento automatico. fortunatamente, Potrebbe non essere necessario padroneggiare il calcolo, È importante solo imparare e comprendere i principi del calcolo. Cosa c'è di più, deve comprendere le applicazioni pratiche del machine learning attraverso il calcolo durante la costruzione del modello.

Quindi, Se si capisce come la derivata della funzione restituisce il suo tasso di variazione nel calcolo, sarà in grado di comprendere il concetto di discesa in pendenza. Nella discesa in pendenza, dobbiamo trovare i minimi locali per una funzione e così via. Se hai punti di sedia o più minimi, una discesa in pendenza può trovare un minimo locale e non un minimo complessivo, a meno che non si parta da più punti. Alcuni degli argomenti necessari per padroneggiare la parte di calcolo nella scienza dei dati sono il calcolo differenziale e integrale, Derivate parziali, Funzioni di valore vettoriale, Gradienti direzionali.

Il calcolo multivariato viene utilizzato nell'addestramento degli algoritmi, così come nella discesa delle pendenze. Derivato, divergenza, la curvatura e le approssimazioni quadratiche sono concetti importanti che puoi imparare e implementare.

La matematica dell'apprendimento automatico può sembrare intimidatoria in questo momento, tuttavia, Sarai in grado di comprendere i concetti di calcolo necessari per costruire un modello di machine learning di successo in pochi giorni di apprendimento costruttivo.

Uso di statistiche descrittive

La statistica descrittiva è un concetto fondamentale che ogni aspirante data scientist deve imparare a comprendere l'apprendimento automatico quando lavora con classificazioni come la regressione logistica., distribuzioni, analisi della discriminazione e test di ipotesi.

Se stavo lottando con le statistiche a scuola, allora devi mettere il tuo 200 percentuale per imparare la parte matematica della statistica, in quanto è molto essenziale per te diventare uno scienziato dei dati di successo. Per dirla in parole più semplici, la statistica è la parte principale della matematica per l'apprendimento automatico. Alcune delle statistiche fondamentali necessarie per il ML sono combinatorie, Assiomi, Teorema di Bayes, Varianza e aspettativa, Variabili casuali, Distribuzioni condizionali e congiunte.

Matematica discreta nell'apprendimento automatico

La matematica discreta si occupa di numeri non continui, il più delle volte intero. Molte applicazioni richiedono l'uso di numeri discreti. Quando si pianifica una flotta di taxi, ad esempio, Impossibile inviare 0,34 tattismo; è necessario inviare il file completo. Non puoi avere mezzo postino o farlo visitare 1 e mezzo posto per consegnare le lettere.

Molte delle strutture dell'intelligenza artificiale sono discrete. Una rete neurale, ad esempio, ha un numero intero di nodi e interconnessioni. Non puoi avere 0,65 nodi o un nono di un collegamento. Di conseguenza, La matematica utilizzata per costruire una rete neurale deve includere un elemento discreto, Il numero intero rappresenta il numero di nodi e interconnessioni.

Puoi farla franca con i fondamenti della matematica discreta per l'apprendimento automatico, a meno che non si desideri lavorare con domini relazionali, modelli grafici, problemi combinatori, previsione strutturata, eccetera. Per padroneggiare questi concetti, dovresti consultare libri di matematica discreta. Fortunatamente per i laureati in informatica, questi concetti sono adeguatamente trattati nella tua università. tuttavia, Altri potrebbero aver bisogno di sforzarsi di più per comprendere questo argomento. Perciò, la matematica discreta è una componente molto importante dell'IA & ML.

11332how-does-math-matter-in-data-science-6-638-1907947

Teoria della probabilità nell'apprendimento automatico

Per lavorare correttamente su un progetto di modellazione predittiva di machine learning, sarebbe ragionevole concludere che la probabilità è essenziale.

L'apprendimento automatico è il processo di creazione di modelli di previsione da dati ambigui. Lavorare con informazioni errate o incomplete è ciò che viene fornito con l'incertezza.

L'incertezza è fondamentale per l'apprendimento automatico, tuttavia, è uno dei componenti che crea più difficoltà per i nuovi arrivati, in particolare coloro che provengono da un background di programmazione.

Nell'apprendimento automatico, ci sono tre principali fonti di incertezza: dati rumorosi, copertura limitata dell'area problematica e, Certo, modelli imperfetti. tuttavia, con l'aiuto dei giusti strumenti di probabilità, possiamo stimare la soluzione al problema.

La probabilità è essenziale per testare ipotesi e distribuzioni come la distribuzione gaussiana e la funzione di densità di probabilità..

Diamo ora un'occhiata alle applicazioni una volta analizzati i tipi in matematica e scienza dei dati..

Perché dovresti preoccuparti della matematica? Perché hai bisogno della matematica nei progetti di machine learning?

Ci sono numerose ragioni per cui la matematica per l'apprendimento automatico è importante., e condividerò alcuni dei suggerimenti importanti di seguito:

  • La scelta del miglior algoritmo richiede di tenere conto della precisione, tempo di formazione, la complessità del modello, il numero di parametri e il numero di funzioni.

  • Scelta dei valori dei parametri e metodi di convalida.

  • La comprensione della compensazione della varianza di bias consente di identificare i problemi di overfit e di mancata corrispondenza che si verificano in genere durante l'esecuzione del programma..

  • Determinare l'intervallo di confidenza e l'incertezza corretti.

Qual è il modo giusto per imparare la matematica per la scienza dei dati e l'apprendimento automatico??

24384stencil-default-8961707

Sebbene ci siano molte risorse preziose disponibili su Internet che spiegano concetti come il calcolo dei vettori di decomposizione della matrice, la matrice di geometria analitica dell'algebra lineare, la matematica alla base dell'analisi dei componenti principali e supporta le macchine vettoriali. Non tutte le risorse sono una soluzione completa per la tua comprensione. Perciò, Ho compilato un elenco di libri, siti web e canali YouTube che possono aiutarti a migliorare il tuo concetto teorico nel campo dell'intelligenza artificiale.

  1. Matematica per l'apprendimento automatico di Marc Peter Deisenroth è il libro che può aiutarti a iniziare il tuo viaggio matematico. Le applicazioni pratiche degli algoritmi e la matematica dietro di essi sono state chiaramente spiegate. Tutti i concetti di matematica sono stati spiegati correttamente. Puoi controllare il pdf online qui -https: //mml-book.github.io/book/mml-book.pdf

  2. Calcolo multivariato dell'Imperial College di Londra – L'Imperial College di Londra ha fondamentalmente creato una serie di YouTube che copre gli importanti concetti del calcolo multivariato e la sua applicazione in vari algoritmi ml.. Anche se l'intero corso è in collaborazione con Coursera, L'Imperial College di Londra lo ha messo a disposizione gratuitamente di tutti gli studenti curiosi.

  3. Corsi Khan Academy su Algebra lineare, Probabilità e statistica, Calcolo multivariato, e Miglioramento– Una risorsa molto completa e gratuita disponibile per tutti gli studenti per ampliare le loro conoscenze in concetti complessi come la matrice di geometria analitica dell'algebra lineare.

  4. Tutte le statistiche: un corso sintetico di inferenza statistica di Larry Wasserman è presumibilmente un'altra risorsa completa che contiene una spiegazione dettagliata di concetti importanti come

  5. Da Udacity Introduzione alle statistiche– è un'altra risorsa gratuita attraverso la quale è possibile ottenere un livello iniziale di comprensione nel campo delle statistiche che è necessario per la scienza dei dati.

conclusione

Ti porterà tra 3 e 4 mesi imparare concetti matematici e metterli in pratica. Dai un'occhiata alle risorse sopra menzionate e non dimenticare di continuare a impararlo insieme agli algoritmi di apprendimento automatico in modo da poter capire qual è l'algoritmo giusto che dovresti scegliere per il tuo modello.

Il supporto mostrato in questo articolo non è di proprietà di Analytics Vidhya e viene utilizzato a discrezione dell'autore.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.