Mathematik für maschinelles Lernen | Mathematik für Data Science

Inhalt

Dieser Artikel wurde im Rahmen der Data Science Blogathon

51102ml-8797358

Sie sind ein angehender Data Scientist und fasziniert von der Funktionsweise der Welt von Data Science und Machine Learning?? Gut, Herzlichen Glückwunsch zur Wahl des richtigen Karrierewegs, der zu diesem Zeitpunkt am besten zu Ihren Bedürfnissen passt. Aber trotzdem, Wussten Sie, dass Sie Mathematik für Machine Learning und Data Science beherrschen müssen?? Jawohl, du hast gut gehört.

Egal, welche Hassliebe du in der Schule zu Mathe hattest. Die grundlegenden Konzepte, die in Mathematik und Statistik verwendet werden, sind tatsächlich sehr nützlich, um strategische Entscheidungen beim Entwurf von Modellen für maschinelles Lernen zu treffen.. Dann, wenn Sie sich für diesen Beruf im Bereich Data Science entschieden haben, Sie müssen anfangen, die Konzepte der Mathematik zu lieben und sie in Ihrer Zukunft umzusetzen, da es eine der Voraussetzungen für maschinelles Lernen ist.

Was ist der Zusammenhang zwischen maschinellem Lernen und Mathematik??

18057whatsapp20image202021-05-3120at208-41-4320pm201-6071198

Beim maschinellen Lernen dreht sich alles um Mathematik, was wiederum dazu beiträgt, einen Algorithmus zu erstellen, der aus Daten lernen kann, um eine genaue Vorhersage zu treffen. Die Vorhersage könnte so einfach sein wie die Klassifizierung von Hunden oder Katzen aus einer bestimmten Reihe von Bildern oder die Art von Produkten, die einem Kunden basierend auf früheren Einkäufen empfohlen werden sollen.. Deswegen, Es ist sehr wichtig, die mathematischen Konzepte hinter jedem Kernalgorithmus für maschinelles Lernen richtig zu verstehen. Daher, hilft Ihnen bei der Auswahl der richtigen Algorithmen für Ihr Data Science- und Machine Learning-Projekt.

Maschinelles Lernen beruht in erster Linie auf mathematischen Voraussetzungen, solange Sie verstehen, warum Mathematik verwendet wird, du wirst es interessanter finden. Mit diesem, Sie werden verstehen, warum wir einen Algorithmus für maschinelles Lernen dem anderen vorziehen und wie sich dieser auf die Leistung des Modells für maschinelles Lernen auswirkt.

Punkte, die in diesem Blogbeitrag behandelt werden sollen

  1. Welche mathematischen Konzepte spielen beim maschinellen Lernen eine Rolle??

  2. Warum brauchen Sie Mathematik in Machine-Learning-Projekten??

  3. Wie lernt man es richtig?

Im heutigen Blogbeitrag, Wir werden genau alle mathematischen Konzepte besprechen, die Sie benötigen, um Data Science und Machine Learning-Konzepte zu beherrschen. Wir werden auch lernen, warum wir Mathematik beim maschinellen Lernen mit einigen Beispielen verwenden.

Beginnen wir mit einem Blick auf die vielen Formen der Mathematik, die in Data Science und Machine Learning verwendet werden, damit Sie besser verstehen, was Sie wirklich über Mathematik für den Data Science-Beruf wissen müssen..

Welche mathematischen Konzepte werden in Data Science und Machine Learning umgesetzt

Maschinelles Lernen basiert auf vier kritischen Konzepten und ist statistisch, Lineare Algebra, Wahrscheinlichkeit und Berechnung. Während statistische Konzepte der zentrale Teil jedes Modells sind, Kalkül hilft uns, ein Modell zu lernen und zu optimieren. Lineare Algebra ist außergewöhnlich nützlich, wenn Sie mit einem großen Datensatz arbeiten, und die Wahrscheinlichkeit hilft, die Fortdauer von Ereignissen vorherzusagen, die auftreten werden.. Dies sind die mathematischen Konzepte, auf die Sie in Ihrer Karriere im Bereich Data Science und maschinelles Lernen häufig stoßen werden..

Mathematische Konzepte wichtig für Machine Learning und Data Science:

  1. Lineare Algebra

  2. Berechnung

  3. Wahrscheinlichkeitstheorie

  4. Diskrete Mathematik

  5. Statistiken

97735whatsapp20image202021-05-3120at208-41-4420pm-5736471

Konzept der linearen Algebra im maschinellen Lernen:

Zu verstehen, wie man lineare Gleichungen erstellt, ist eine entscheidende Komponente bei der Entwicklung von Kernalgorithmen für maschinelles Lernen.. Diese werden verwendet, um die Datenerhebung auszuwerten und zu beobachten. Lineare Algebra wird in maschinellen Lernalgorithmen auf Verlustfunktionen angewendet, Regulierung, Matrizen de covarianza, Einzelwertzerlegung (SVD), Matrixoperationen und Klassifizierung von Support Vector Machines. Es wird auch in maschinellen Lernalgorithmen wie der linearen Regression angewendet. Dies sind die Konzepte, die zum Verständnis der Optimierungsmethoden für maschinelles Lernen erforderlich sind.

Um eine Hauptkomponentenanalyse durchzuführen, die verwendet wird, um die Dimensionalität der Daten zu reduzieren, wir verwenden lineare Algebra. Lineare Algebra wird auch häufig in neuronalen Netzen zum Rendern und Verarbeiten von Netzwerken verwendet. Unnötig zu erwähnen, dass Sie sich für lineare Algebra interessieren müssen, da es im Bereich der Datenwissenschaft weit verbreitet ist.

Aber trotzdem, lass dich davon nicht einschüchtern, da das Verständnis der Konzepte wichtig ist, aber Sie müssen kein Experte in linearer Algebra sein, um die meisten Probleme zu lösen. Nur ein solides Verständnis der Konzepte ist gut genug. Math for Machine Learning von Marc Peter Deisenroth ist ein ausgezeichnetes Buch, das Ihnen hilft, diese Reise zu beginnen, wenn Sie zunächst mit Mathematik zu kämpfen haben..

Berechnung im maschinellen Lernen:

Viele Schüler, die das Rechnen, das ihnen in der Schule beigebracht wurde, nicht lernen mochten, werden es hart treffen., da es ein integraler Bestandteil des maschinellen Lernens ist. Glücklicherweise, Sie müssen möglicherweise keine Kenntnisse in Kalkulation haben, es ist nur wichtig, die Prinzipien der Infinitesimalrechnung zu lernen und zu verstehen. Was ist mehr, Sie müssen die praktischen Anwendungen des maschinellen Lernens durch Berechnung während des Modellbaus verstehen.

Dann, wenn Sie verstehen, wie die Ableitung der Funktion ihre Änderungsrate in der Berechnung zurückgibt, das Konzept des Gradientenabstiegs verstehen. Auf der Steigungsabfahrt, wir müssen die lokalen Minima für eine Funktion finden und so weiter. Wenn Sie Sattelpunkte oder mehrere Minima haben, ein Gradientenabstieg kann ein lokales Minimum und kein globales Minimum finden, es sei denn, Sie beginnen von mehreren Punkten. Einige der Themen, die erforderlich sind, um den Teil der Analysis in der Datenwissenschaft zu meistern, sind Differential- und Integralrechnung, Teilderivate, Vektorwertfunktionen, Richtungsverläufe.

Multivariate Berechnung wird beim Algorithmustraining verwendet, sowie bei der Abfahrt von Steigungen. Derivate, Abweichungen, Krümmung und quadratische Approximationen sind wichtige Konzepte, die Sie lernen und implementieren können.

Machine-Learning-Mathematik mag Ihnen im Moment einschüchternd erscheinen, aber trotzdem, Sie werden in der Lage sein, in wenigen Tagen konstruktiven Lernens die Rechenkonzepte zu verstehen, die erforderlich sind, um ein erfolgreiches Modell für maschinelles Lernen zu erstellen.

Verwendung deskriptiver Statistiken

Deskriptive Statistik ist ein grundlegendes Konzept, das jeder angehende Datenwissenschaftler lernen muss, maschinelles Lernen zu verstehen, wenn er mit Klassifikationen wie der logistischen Regression arbeitet., Ausschüttungen, Diskriminierungsanalyse und Hypothesentest.

Wenn ich in der Schule mit Statistiken zu kämpfen hätte, dann musst du deine 200 Prozent, um den mathematischen Teil der Statistik zu lernen, da es für Sie sehr wichtig ist, ein erfolgreicher Data Scientist zu werden. Um es in einfacheren Worten auszudrücken, Statistik ist der Hauptbestandteil der Mathematik für maschinelles Lernen. Einige der grundlegenden Statistiken, die für ML benötigt werden, sind Kombinatorik, Axiome, Teorema de Bayes, Abweichung und Erwartung, Zufällige Variablen, Bedingte und gemeinsame Verteilungen.

Diskrete Mathematik im maschinellen Lernen

Diskrete Mathematik beschäftigt sich mit nicht stetigen Zahlen, meistens ganze Zahlen. Viele Anwendungen erfordern die Verwendung diskreter Zahlen. Bei der Planung einer Taxiflotte, zum Beispiel, kann es nicht versenden 0,34 Taxen; Sie müssen die vollständigen senden. Kann keinen halben Postboten haben oder ihn besuchen lassen 1 anderthalb Plätze, um die Briefe zu liefern.

Viele der Strukturen der künstlichen Intelligenz sind diskret. Una rotes Neuronal, zum Beispiel, hat eine ganze Zahl von Knoten und Verbindungen. Nicht haben können 0,65 Knoten oder ein Neuntel eines Links. Infolge, Die Mathematik, die zum Aufbau eines neuronalen Netzes verwendet wird, muss ein diskretes Element enthalten, die ganze Zahl steht für die Anzahl der Knoten und Verbindungen.

Sie können mit den Grundlagen der diskreten Mathematik für maschinelles Lernen durchkommen, es sei denn, Sie möchten mit relationalen Domänen arbeiten, grafische Modelle, kombinatorische Probleme, strukturierte Vorhersage, etc. Um diese Konzepte zu meistern, muss Bücher über diskrete Mathematik konsultieren. Zum Glück für Informatik-Absolventen, diese Konzepte werden an Ihrer Hochschule ausreichend abgedeckt. Aber trotzdem, andere müssen sich möglicherweise mehr anstrengen, um dieses Thema zu verstehen. Deswegen, diskrete Mathematik ist ein sehr wichtiger Bestandteil von KI & ML.

11332wie-macht-mathematik-in-data-science-6-638-1907947

Wahrscheinlichkeitstheorie im maschinellen Lernen

Um in einem prädiktiven Modellierungsprojekt für maschinelles Lernen richtig zu arbeiten, es wäre vernünftig zu folgern, dass die Wahrscheinlichkeit wesentlich ist.

Machine Learning ist der Prozess der Erstellung von Vorhersagemodellen aus mehrdeutigen Daten. Das Arbeiten mit fehlerhaften oder unvollständigen Informationen führt zu Unsicherheit.

Unsicherheit ist entscheidend für maschinelles Lernen, aber trotzdem, es ist eine der Komponenten, die Neueinsteigern mehr Schwierigkeiten bereitet, insbesondere diejenigen, die aus Programmiererfahrung kommen.

Beim maschinellen Lernen, Es gibt drei Hauptquellen der Unsicherheit: verrauschte Daten, begrenzte Abdeckung des Problembereichs und, Natürlich, unvollkommene Modelle. Aber trotzdem, mit Hilfe der richtigen Wahrscheinlichkeitstools, wir können die Lösung des Problems abschätzen.

Wahrscheinlichkeit ist für Tests von Hypothesen und Verteilungen wie der Gauß-Verteilung und der Wahrscheinlichkeitsdichtefunktion unerlässlich.

Schauen wir uns nun die Anwendungen an, nachdem wir die Typen in Mathematik und Datenwissenschaft analysiert haben.

Warum solltest du dich für Mathe interessieren?? Warum brauchen Sie Mathematik in Machine-Learning-Projekten??

Es gibt zahlreiche Gründe, warum Mathematik für maschinelles Lernen wichtig ist, und ich werde einige der wichtigen Tipps weiter unten teilen:

  • Die Auswahl des besten Algorithmus erfordert die Berücksichtigung der Präzision, Trainings zeit, die Komplexität des Modells, die Anzahl der Parameter und die Anzahl der Funktionen.

  • Auswahl der Parameterwerte und Validierungsmethoden.

  • Das Verständnis der Bias-Varianz-Kompensation ermöglicht es Ihnen, Überanpassungs- und Fehlanpassungsprobleme zu identifizieren, die normalerweise beim Ausführen des Programms auftreten.

  • Bestimmung des richtigen Konfidenzintervalls und der Unsicherheit.

Wie lernt man Mathematik für Data Science und Machine Learning richtig??

24384Schablone-Standard-8961707

Obwohl es im Internet viele wertvolle Ressourcen gibt, die Konzepte wie die Berechnung von Matrixzerlegungsvektoren erklären, die Matrix der analytischen Geometrie der linearen Algebra, die Mathematik hinter der Hauptkomponentenanalyse und Support-Vektor-Maschinen. Nicht alle Ressourcen sind eine umfassende Lösung für Ihr Verständnis. Deswegen, Ich habe eine Bücherliste zusammengestellt, YouTube-Websites und -Kanäle, die Ihnen helfen können, Ihr theoretisches Konzept im Bereich der künstlichen Intelligenz zu verbessern.

  1. Mathematik für maschinelles Lernen von Marc Peter Deisenroth ist das Buch, das dir helfen kann, deine Mathereise zu beginnen. Die praktischen Anwendungen der Algorithmen und die dahinterstehende Mathematik wurden anschaulich erklärt. Alle Konzepte der Mathematik wurden richtig erklärt. Sie können das PDF hier online überprüfen - https: //mml-book.github.io/book/mml-book.pdf

  2. Multivariate Infinitesimalrechnung vom Imperial College London – Das Imperial College London hat im Grunde eine YouTube-Serie erstellt, die die wichtigen Konzepte der multivariaten Berechnung und deren Anwendung in verschiedenen ml-Algorithmen behandelt.. Obwohl der gesamte Kurs in Zusammenarbeit mit Coursera, Das Imperial College London hat es allen neugierigen Studenten kostenlos zur Verfügung gestellt.

  3. Kurse der Khan Academy zu Lineare Algebra, Wahrscheinlichkeit und Statistik, Multivariable Berechnung, Ja Verbesserung– Eine sehr umfassende und kostenlose Ressource, die allen Schülern zur Verfügung steht, um ihr Wissen über komplexe Konzepte wie die Lineare Algebra Analytic Geometry Matrix . zu erweitern.

  4. Alle Statistiken: ein kompakter Kurs in statistischer Inferenz von Larry Wasserman ist angeblich eine weitere umfassende Ressource, die eine detaillierte Erklärung wichtiger Konzepte enthält, wie z

  5. De Udacity Einführung in die Statistik– ist eine weitere kostenlose Ressource, mit der Sie ein erstes Verständnis im Bereich der Statistik erlangen können, das für die Datenwissenschaft benötigt wird.

Fazit

Es wird dich dazwischen bringen 3 Ja 4 Monate, um mathematische Konzepte zu erlernen und in die Praxis umzusetzen. Sehen Sie sich die oben genannten Ressourcen an und vergessen Sie nicht, sie zusammen mit den Algorithmen für maschinelles Lernen zu lernen, damit Sie verstehen, welcher Algorithmus für Ihr Modell der richtige ist..

Die in diesem Artikel gezeigten Medien sind nicht Eigentum von Analytics Vidhya und werden nach Ermessen des Autors verwendet.

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.