Diskrete Wahrscheinlichkeitsverteilungen | Arten von Wahrscheinlichkeitsverteilungen

Inhalt

Dieser Artikel wurde im Rahmen der Data Science Blogathon.

Einführung

Heute, Lassen Sie uns über eines der grundlegenden Konzepte der Statistik sprechen: Wahrscheinlichkeitsverteilungen. Sie helfen, die Daten besser zu verstehen und dienen als Grundlage für das Verständnis statistischer Konzepte, wie Konfidenzintervalle und Hypothesentests.

Informelle Definition

Sei X eine Zufallsvariable mit mehr als einem möglichen Ergebnis. Tragen Sie die Wahrscheinlichkeit auf der y-Achse und das Ergebnis auf der x-Achse. Wenn wir das Experiment viele Male wiederholen und die Wahrscheinlichkeit jedes möglichen Ergebnisses grafisch darstellen, erhalten wir einen Graphen, der die Wahrscheinlichkeiten repräsentiert. Dieser Graph heißt Wahrscheinlichkeitsverteilung (PD). Die Höhe des Graphen für X gibt die Wahrscheinlichkeit dieses Ergebnisses an.

24896Binomial-2152455

Arten von Wahrscheinlichkeitsverteilungen

Je nach Art der durch die Experimente erzeugten Daten gibt es zwei Arten von Verteilungen.

1. Diskrete Wahrscheinlichkeitsverteilungen

Diese Verteilungen modellieren die Wahrscheinlichkeiten von Zufallsvariablen, die als Ergebnisse diskrete Werte haben können.. Zum Beispiel, die möglichen Werte für die Zufallsvariable X, die die Anzahl der Köpfe darstellt, die auftreten können, wenn eine Münze zweimal geworfen wird, sind der Satz {0, 1, 2} und nicht irgendein Wert von 0 ein 2 Was 0.1 Ö 1.6.

Beispiele: Bernoulli, Binomial, negatives Binomial, Hypergeometrisch, etc.,

2. Kontinuierliche Wahrscheinlichkeitsverteilungen

Diese Verteilungen modellieren die Wahrscheinlichkeiten von Zufallsvariablen, die jedes mögliche Ergebnis haben können.. Zum Beispiel, die möglichen Werte für die Zufallsvariable X, die das Gewicht der Bürger in einer Stadt darstellt, die einen beliebigen Wert haben können wie 34,5, 47,7, etc.

Beispiele: Normal, T der Student, Chi im Quadrat, Exponentiell, etc.,

Terminologien

Jeder DP liefert uns zusätzliche Informationen über das Verhalten der betroffenen Daten.. Jede PD ist durch eine Wahrscheinlichkeitsfunktion gegeben, die die Wahrscheinlichkeiten der Ergebnisse verallgemeinert.

Mit diesem, Wir können die Wahrscheinlichkeit eines bestimmten Ergebnisses abschätzen (diskret) oder die Wahrscheinlichkeit, dass es für ein bestimmtes Ergebnis in einen bestimmten Wertebereich fällt (kontinuierlich). Die Funktion heißt Wahrscheinlichkeitsmassenfunktion (PMF) für diskrete Verteilungen und Wahrscheinlichkeitsdichtefunktion (PDF) für kontinuierliche Verteilungen. Der Gesamtwert von PMF und PDF in der gesamten Domäne ist immer gleich eins.

Verteilungsfunktion

Das PDF gibt die Wahrscheinlichkeit eines bestimmten Ergebnisses an, während die kumulative Verteilungsfunktion die Wahrscheinlichkeit angibt, ein Ergebnis zu sehen, das kleiner oder gleich einem bestimmten Wert der Zufallsvariablen ist. CDFs werden verwendet, um zu überprüfen, wie die Wahrscheinlichkeit bis zu einem bestimmten Punkt aufaddiert wurde. Zum Beispiel, und P (X = 5) ist die Wahrscheinlichkeit, dass die Anzahl der Köpfe beim Werfen einer Münze beträgt 5, P (x <= 5) bezeichnet die kumulative Wahrscheinlichkeit, aus zu erhalten 1 ein 5 Gesichter.

Kumulative Verteilungsfunktionen werden auch zur Berechnung von p-Werten im Rahmen von Hypothesentests verwendet..

Diskrete Wahrscheinlichkeitsverteilungen

Es gibt viele diskrete Wahrscheinlichkeitsverteilungen, die in verschiedenen Szenarien verwendet werden können. Wir werden in diesem Beitrag diskrete Verteilungen diskutieren.. Die Binomial- und Poisson-Verteilungen werden in der folgenden Liste am häufigsten diskutiert.

1. Bernoulli-Verteilung

Diese Verteilung wird erzeugt, wenn wir ein Experiment einmal durchführen und es nur zwei mögliche Ergebnisse hat: Erfolg und Niederlage. Tests dieser Art werden Bernoulli-Tests genannt., die die Grundlage vieler unten diskutierter Verteilungen bilden. Sei p die Erfolgswahrscheinlichkeit und 1 – p ist die Ausfallwahrscheinlichkeit.

Der PMF wird angegeben als

22323bernoulli_pmf-1340999

Ein Beispiel dafür wäre, einmal eine Münze zu werfen. p ist die Wahrscheinlichkeit des Weiterkommens und 1 – p ist die Wahrscheinlichkeit, einen Schwanz zu erhalten. Bitte beachten Sie, dass Erfolg und Misserfolg subjektiv sind und wir sie basierend auf dem Kontext definieren.

2. Binomialverteilung

Dies wird für Zufallsvariablen mit nur zwei möglichen Ergebnissen generiert. Sei p die Wahrscheinlichkeit, dass ein Ereignis erfolgreich ist, was impliziert, dass 1 – p ist die Wahrscheinlichkeit, dass das Ereignis ein Fehler ist. Wenn wir das Experiment wiederholt durchführen und die Wahrscheinlichkeit jedes Mal grafisch darstellen, erhalten wir die Binomialverteilung.

Das gebräuchlichste Beispiel für die Binomialverteilung ist, eine Münze n-mal zu werfen und die Wahrscheinlichkeiten zu berechnen, eine bestimmte Anzahl von Köpfen zu erhalten. Weitere Beispiele aus der Praxis sind die Anzahl erfolgreicher Verkaufsgespräche für ein Unternehmen oder ob ein Medikament bei einer Krankheit wirkt oder nicht..

Der PMF wird angegeben als,

55002binomial_pmf-9219053

wobei p die Erfolgswahrscheinlichkeit ist, n ist die Anzahl der Versuche und x ist die Häufigkeit, mit der wir erfolgreich sind.

3. Hypergeometrische Verteilung

Betrachten Sie den Fall, eine rote Murmel aus einer Schachtel mit verschiedenfarbigen Murmeln zu entfernen.. Das Ziehen einer roten Kugel ist ein Erfolg und das Nichtziehen ist ein Misserfolg. Aber jedes Mal, wenn eine Murmel gezogen wird, es wird nicht in die Schachtel zurückgeschickt und, Daher, dies beeinflusst die Wahrscheinlichkeit, in der nächsten Runde einen Ball zu bekommen. Die hypergeometrische Verteilung modelliert die Wahrscheinlichkeit von k Erfolgen in n Versuchen, wobei jeder Versuch ersatzlos durchgeführt wird. Dies unterscheidet sich von der Binomialverteilung, bei der die Wahrscheinlichkeit während der Versuche konstant bleibt..

Der PMF wird angegeben als,

85862hypergeometrisch-1646114

wobei k die Anzahl der möglichen Erfolge ist, x ist die gewünschte Anzahl an Erfolgen, N ist die Populationsgröße und n ist die Anzahl der Versuche.

4. Negative Binomialverteilung

Manchmal möchten wir überprüfen, wie viele Bernoulli-Tests wir durchführen müssen, um ein bestimmtes Ergebnis zu erhalten. Das gewünschte Ergebnis wird vorab festgelegt und wir setzen das Experiment fort, bis es erreicht ist. Betrachten Sie das Beispiel des Würfelns. Unser Wunschergebnis, als Erfolg definiert, ist zu bekommen 4. Wir wollen die Wahrscheinlichkeit kennen, dieses Ergebnis dreimal zu erhalten. Dies wird als die Anzahl der Ausfälle interpretiert (andere Zahlen außer 4) Was wird passieren, bevor wir den dritten Erfolg sehen.

Der PMF wird angegeben als,

77645nb_formula-6630828

wobei p die Erfolgswahrscheinlichkeit ist, k ist die Anzahl der beobachteten Misserfolge und r ist die gewünschte Anzahl der Erfolge, bis das Experiment abgebrochen wird.

Wie bei der Binomialverteilung, die Wahrscheinlichkeit über Versuche hinweg bleibt konstant und jeder Versuch ist unabhängig vom anderen.

5. Geometrische Verteilung

Dies ist ein Sonderfall einer negativen Binomialverteilung, bei der die gewünschte Anzahl von Erfolgen 1. Misst die Anzahl der Fehler, die wir vor einem Erfolg erhalten. Verwenden des gleichen Beispiels aus dem vorherigen Abschnitt, Wir würden gerne wissen, wie viele Fehler wir sehen, bevor wir die ersten bekommen 4 beim Würfeln.

42464geometrisch-4296509

wobei p die Erfolgswahrscheinlichkeit und k die Anzahl der Fehler ist. Hier, r = 1.

6. Giftverteilung

Diese Verteilung beschreibt die Ereignisse, die in einem festen zeitlichen oder räumlichen Intervall auftreten.. Ein Beispiel könnte dies verdeutlichen. Betrachten Sie die Anzahl der Anrufe, die ein Kundendienstzentrum pro Stunde erhält. Wir können die durchschnittliche Anzahl der Anrufe pro Stunde schätzen, aber wir können die genaue Nummer und die genaue Uhrzeit des Anrufs nicht feststellen. Jedes Auftreten eines Ereignisses ist unabhängig von den anderen Ereignissen.

Der PMF wird angegeben als,

89911poisson_formula-8714956

wobei λ die durchschnittliche Häufigkeit ist, mit der das Ereignis in einem bestimmten Zeitraum aufgetreten ist, x ist das gewünschte Ergebnis und e ist die Euler-Zahl.

7. Multinomialverteilung

In früheren Distributionen, Es gibt nur zwei mögliche Ergebnisse: Erfolg und Niederlage. Aber trotzdem, Multinomialverteilung beschreibt Zufallsvariablen mit vielen möglichen Ergebnissen. Manchmal, dies wird auch als kategoriale Verteilung bezeichnet, da jedes mögliche Ergebnis als separate Kategorie behandelt wird. Betrachten Sie das Szenario, ein Spiel n-mal zu spielen. Die Multinomialverteilung hilft uns, die kombinierte Wahrscheinlichkeit zu bestimmen, dass der Spieler 1 gewinnen x1 mal, der Spieler 2 wird gewinnen x2 mal und Spieler k gewinnt xk mal.

Der PMF wird angegeben als,

45389multinomial_formula-4394383

wobei n die Anzahl der Versuche ist, P1,…… Seitek bezeichne die Wahrscheinlichkeiten von Ergebnissen x1……Xk beziehungsweise.

In diesem Beitrag, Wir haben Wahrscheinlichkeitsverteilungen definiert und verschiedene diskrete Wahrscheinlichkeitsverteilungen kurz diskutiert. Teilen Sie mir Ihre Meinung zu dem Artikel im Kommentarbereich unten mit..

Verweise

1. https://www.statisticshowto.com/

2. https://stattrek.com/

3. Wikipedia

Über mich

Ich bin ein ehemaliger Software-Ingenieur und arbeite an der Umstellung auf Data Science. Ich bin Masterstudent in Data Science. Melde dich gerne bei mir unter https://www.linkedin.com/in/priyanka-madiraju/

Die in diesem Artikel gezeigten Medien sind nicht Eigentum von DataPeaker und werden nach Ermessen des Autors verwendet.

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.