Logistischer Regressionsalgorithmus | Einführung in die logistische Regression

Inhalt

Dieser Artikel wurde im Rahmen der Data Science Blogathon

17404wann-nutzen-data-science-in-seo-5def8e5b1c22c-760x400-2466596

Einführung

Lernen. Die logistische Regression wird im Allgemeinen verwendet, wenn wir die Daten in zwei oder mehr Klassen einteilen müssen. Eine ist binär und die andere ist eine logistische Regression mit mehreren Klassen. Wie der Name schon sagt, die binäre klasse hat 2 Klassen, die ja sind / Nein, Wahr / Gefälscht, 0/1, etc. Bei der Klassifizierung mehrerer Klassen, es gibt mehr von 2 Klassen zum Klassifizieren von Daten. Aber, bevor wir gehen, definieren wir zuerst die logistische Regression:

“Die logistische Regression ist ein Klassifizierungsalgorithmus für kategoriale Variablen wie Ja / Nein, Wahr / Gefälscht, 0/1, etc.”

Wie unterscheidet sie sich von der linearen Regression??

Vielleicht haben Sie auch schon von linearer Regression gehört. Lassen Sie mich Ihnen sagen, dass es einen großen Unterschied zwischen linearer Regression und logistischer Regression gibt. Lineare Regression wird verwendet, um kontinuierliche Werte wie den Preis des Hauses zu generieren, Einkommen, die Bevölkerung, etc. In der logistischen Regression, berechnen wir im Allgemeinen die Wahrscheinlichkeit, die zwischen dem Intervall . liegt 0 Ja 1 (beide inklusive). Dann kann die Wahrscheinlichkeit verwendet werden, um die Daten zu klassifizieren. Zum Beispiel, wenn die berechnete Wahrscheinlichkeit größer als ist 0,5, dann gehörten die Daten zur Klasse A und, andererseits, für weniger als 0,5, die Daten gehörten zur Klasse B.

Aber meine Frage ist, ob wir die lineare Regression noch zur Klassifizierung verwenden können. Meine Antwort wird sein: „Ja!! Warum nicht? Aber es ist sicher eine absurde Idee". Mein Grund wird sein, dass Sie einen Schwellenwert für die lineare Regression zuweisen können, nämlich, wenn der vorhergesagte Wert größer als der Schwellenwert ist, gehörte zur Klasse A; andererseits, zur Klasse B. Aber es wird ein großer Fehler und ein schlechtes Modell mit geringer Präzision geben, das wollen wir wirklich nicht. Rechts? Ich schlage vor, Sie verwenden nur Sortieralgorithmen.

Schauen wir uns nun das unten gezeigte lineare Regressionsdiagramm an.

1111-8048575

(Höflichkeit: https://www.ablebits.com/)

Der Graph ist eine gerade Linie, die durch einige Punkte geht, da wir immer Überanpassungen und Fehlanpassungen von Kurven vermeiden.

Werfen wir nun einen Blick auf den logistischen Regressionsgraphen:

83016hmfile_hash_38a8acae-8495948

Der Graph ist eine gekrümmte Linie statt einer geraden Linie, im Gegensatz zur linearen Regression.

Dies ist ein großer Unterschied zwischen den beiden Regressionsarten, über die wir gerade gesprochen haben.. Also meine nächste Frage ist.

Warum haben wir eine gekrümmte Linie für die logistische Regression anstelle einer geraden??

Um diese Frage zu beantworten, Wir werden ein wenig durch die lineare Regression gehen und von dort aus zur logistischen Regressionskurve kommen. Das ist in Ordnung? Lasst uns beginnen.

83229ohne Titel-1204962

Zur Zeit, die Gleichung für den linearen Klassifikator ist:

77139Gleichung-3720948

Jetzt definieren wir die Werte der variablen Gewichte:

theta_0 = -1 und theta = 0.1

Dann, Unsere Gleichung sieht so aus und das folgende ist der Graph, der die Gleichung in der 2D-Ebene darstellt:

48525ohne Titel1-2963413

Oben ist eine Geradengleichung für die gegebene Gleichung:

h (x) = – 1 + 0.1x

Der Wert der Funktion h (x) wenn x = 13 es ist:

h (13) = – 1+ (0,1) * (13) = 0,3

Wie bereits in diesem Artikel beschrieben, Ich definiere die Schwelle in 0.5, das ist ein beliebiger Wert von h größer als (gleicht) 0.5 wird beschriftet als 1 Ja, andererseits, 0. Wir können es wie folgt in Form einer Stufenfunktion definieren:

72941ohne Titel3-7256514

Jetzt, stimme dem zu, h hat einen Wert von 0.3, daher der Wert von y_hat = 0 nach der oben definierten Funktion.

Jetzt, Hier ist zu beachten, dass jeder Wert größer als 0.5, Angenommen, ich sage, dass der Wert von 'h’ es ist 1000 für einen Wert von x, dann wird es beschriftet als 1 nur, es gibt keinen Unterschied zwischen dem Wert 1 Ja 1000 da beide klassifiziert sind als 1 nur. Es ist richtig? Können wir diese Lösung akzeptieren?? Nun, nein! würde ich nicht akzeptieren !!!

Eine Sache noch, Wie groß ist die Wahrscheinlichkeit, dass h den Wert hat 0.3? All diese Fragen bleiben unbeantwortet. Aus diesen Gründen, Datenwissenschaftler ziehen es nicht vor, lineare Regression für Klassifizierungszwecke zu verwenden.

vor dem Fortfahren, Ich möchte Ihnen zeigen, wie sich die Funktion y_hat grafisch verhält:

32805ohne Titel4-5102590

Es ist besser, wenn wir eine glattere Kurve anstelle der oben genannten haben. Wir werden sehen:

71601ohne Titel45-7899993

Die obige Kurve ist bekannt als Sigmoid-Funktion die wir in diesem Artikel verwenden werden. Hier stelle ich die Sigmoidfunktion vor.

Was ist die Sigmoidfunktion??

Die Sigmoidfunktion wird durch das Symbol sigma . dargestellt. Su comportamiento gráfico se ha descrito en la Abbildung anterior. Die mathematische Gleichung für die Sigmoidfunktion wird unten beschrieben:

81766ohne Titel6-7112094

Die Sigmoidfunktion gibt die Wahrscheinlichkeit an, dass die Daten zu einer bestimmten Klasse gehören, die im Intervall liegt [0,1]. Akzeptiert das Skalarprodukt der Transposition von Theta und dem Merkmalsvektor X als Parameter. Der resultierende Wert ist die Wahrscheinlichkeit.

Deswegen, Wenn P (Y = 1 | x) = Sigmoide (theta * x)

P (Y = 0 | x) = 1- sigmoide (theta * x)

Was ist mehr, Ich möchte, dass Sie das Verhalten der Sigmoidfunktion beobachten:

  • Wenn theta (Umsetzung) * X wird so viel größer, der Sigmoidwert wird gleich 1
  • Wann theta (Umsetzung) * X wird sehr klein, der Sigmoidwert wird gleich 0

Anwendungen der logistischen Regression

In diesem Abschnitt, Ich möchte einige der Anwendungen der logistischen Regression diskutieren.

1. Vorhersage der Wahrscheinlichkeit, dass eine Person einen Herzinfarkt erleidet

2. Vorhersage der Neigung eines Kunden, ein Produkt zu kaufen oder ein Abonnement auszusetzen.

3. Vorhersage der Ausfallwahrscheinlichkeit eines bestimmten Prozesses oder Produkts.

Bevor Sie diesen Artikel beenden, Ich möchte nur zusammenfassen, wann Sie logistische Regression verwenden sollten:

  • Wenn Ihre Daten binär sind: 0/1, Wahr / Gefälscht, Jawohl / Nein
  • Wenn Sie probabilistische Ergebnisse benötigen
  • Wenn Ihre Daten linear getrennt werden können
  • Wenn Sie die Auswirkungen der Funktion verstehen müssen.

Neben der logistischen Regression werden viele andere Klassifikationsalgorithmen wie kNN . verwendet, Entscheidungsbäume, Random Forest und Clustering-Algorithmen als Clustering von k-Means. Aber die logistische Regression ist ein weit verbreiteter Algorithmus und auch einfach zu implementieren..

Es ging also um den logistischen Regressionsalgorithmus für Anfänger. Wir haben über alles gesprochen, was Sie über die logistische Regressionstheorie wissen müssen. Ich hoffe, Ihnen hat mein Artikel gefallen!!

Die in diesem Artikel gezeigten Medien sind nicht Eigentum von DataPeaker und werden nach Ermessen des Autors verwendet.

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.